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Beschreibung 

[0001] Die Erfindung betrifft ein Hepatitis C Virus (HCV) Zellkultursystem, das im wesentlichen eukaryontische Zel- 
len umfalit, die eingeschleustes HCV-spezifisches Genmaterial enthalten, d.h. die mit HCV-spezifischem Genmaterial 
5 transfiziert sind. 

[0002] Das Hepatitis C Virus (HCV) ist eine der Hauptursachen chronischer und sporadischer Leberkrankungen 
weltweit. Die meisten HCV-lnfektionen verlaufen ohne erkennbare klinische Symptome, allerdings werden 80-90% der 
Infizierten dauerhafte Virustrager und bei 50% dieser dauerhaften VirustrSger kommt es zu einer chronischen Leber- 
entzundung mit unterschiedlichen Schweregraden. Ca. 20% der chronisch Infizierten entwickeln im Laufe von 10 bis 20 

10 Jahren eine Leberzirrhose. auf deren Basis sich ein primages Leberzellkarzinom entwickeln kann. Die chronische 
Hepatitis C ist heute die Hauptindlkation fur eine Lebertransplantation. Eine Kausaltherapie gibt es bisher noch nicht. 
Die einzige derzelt verfOgbare Therapie ist die hochdosierte Verabreichung von Interferon-Alpha Oder eine Kombination 
aus Interferon-Alpha und dem Purin-Nukleosidanalogon Ribavirin. Allerdings sprechen nur ca. 60 % aller Behandelten 
auf diese Therapie an und bei diesen kommt es in mehr als der Halfte aller FaMIe nach dem Absetzen der Behandlung 

15 zu einer erneuten VirSmie. 

Aufgrund der hohen PrSvalenz, gerade auch in den IndustrielSndern, den schwerwiegenden Folgen chronischer Infek- 
tionen und dem Fehlen einer Kausaltherapie ist die Entwicklung einer HCV-spezifischen Chemotherapie ein wesentli- 
ches Ziel der pharmazeutischen Forschung und Entwicklung. Hauptproblem hierbei ist bisher das Fehlen eines 
geeigneten Zellkultursystems, das ein Studium der Virus-Replikation und der Pathogenese in eukaryontlschen Zellen 

20 ermflglicht. 

[0003] Aufgrund der geringen Virusmengen im Blut bzw. Gewebe, dem Fehlen geeigneter Zellkultursysteme oder 
Tiermodelle (bis heute ist der Schimpanse das einzige mOgliche Versuchstier) sowie dem Fehlen effizienter Systeme 
zur Produktion virus-Shnlicher Partikel, konnte die molekulare Zusammensetzung des HCV-Partikels bis heute noch 
nicht eingehend untersucht bzw. aufgekiart werden. Die derzeit vorliegenden Ergebnisse lessen sich wie folgt zusam- 

25 menfassen: Das HCV ist ein umhulltes Plusstrang RNA Virus mit einem Partikeldurchmesser von 50-60 nm und einer 
mittleren Dichte von 1,03-1, 1g/ml. Es wurde erstmals 1989 molekular kloniert und charakterisiert (Choo et af. t 1989: 
Science, 244, 359-362). Die HCV-RNA hat eine LSnge von ca. 9.6 kb (= 9600 Nukleotide), eine positive Polaritat und 
besitzt ein einziges offenes Leseraster (ORF = open reading frame), das ein lineares Polyprotein von ca 3010 Amino- 
sSuren kodiert (siehe Rice 1996, In Virology, B. N. Fields, D. M. Knipe, P. M. Howley, Eds. (Lippincott-Raven, Philadel- 

30 phia, PA, 1996), vol. 1, pp.931-960; Clarke 1997, J. Gen. Virol. 78, 2397; und Bartenschlager 1997, Intervirology 40, 
378 und vgl. Fig. 1 A). Bei der Virusreplikation wird das Polyprotein durch zellulSre und virale Proteasen in die reifen 
und funktionell aktiven Proteine gespalten. 

Innerhalb des Polyproteins sind die Proteine wie folgt angeordnet (vom Amino- zum Carboxyterminus): Core-E1-E2-p7- 
NS2-NS3-NS4A-NS4B-NS5A-NS5B. Das Core-Protein ist die Hauptkomponente des Nukleokapsids. Die Glykoprote- 

35 ine E1 und E2 sind Transmembran proteine und Hauptkomponenten der Virushulle. Sie spielen wahrscheinlich bei der 
Anheftung des Virus an die Wirtszelle eine wesentliche Rolle. Diese drei Proteine Core, E1 und E2 bauen den Virus- 
partikel auf und werden deshalb als Strukturproteine bezeichnet. Die Funktion des Proteins p7 ist noch unklar. Das Pro- 
tein NS2 ist wahrscheinlich die katalytische DomSne der NS2-3 Protease, die fur die Prozesierung zwischen den 
Proteinen NS2 und NS3 verantwortlich ist. Das Protein NS3 hat zwei Funktionen, namlich in der aminoterminalen 

40 Domdne eine ProteaseaktivitSt, die fur die Polyproteinprozessierung essentieil ist, und in der carboxyterminalen 
DomSne eine NTPase/Helikase-Funktion, die wahrscheinlich bei der Repllkation der viralen RNA eine Rolle spielt. Das 
Protein NS4A ist ein Kofaktor der NS3-Protease. Die Funktion des Proteins NS4B ist unbekannt. 
[0004] Das offene Leseraster Ist an seinem 5' Ende von einer ca 340 Nukleotide langen nicht-translatierten Region 
(NTR = non-translated region) flankiert, die als interne Ribosomenansatzstelle (IRES = internal ribosome entry site) 

45 fungiert, und an seinem 3' Ende von einer ca. 230 Nukleotide langen NTR, die hbchstwahrscheinlich fOr die Genomre- 
plikation von Bedeutung Ist. Eine solche 3' NTR ist Gegenstand der Patentanmeldung PCT/US 96/14033. Die Struktur- 
proteine in dem amino-terminalen Viertel des Polyproteins werden von der Signalpeptidase der Wirtszelle gespalten. 
Die Nicht-Strukturproteine (NS) 2 bis (NS) 5B werden von zwei viralen Enzymen prozessiert, namlich von der NS2-3 
und der NS3/4A Proteinase. Die NS3/4A Proteinase wird fur alle Spaltungen jenseits des Carboxyterminus von NS3 

so bendtigt. Die Rolle von NS4B ist nicht bekannt. NS5A, ein hoch phosphoryliertes Protein, scheint fur die Interferon 
Resistenz verschiedener HCV-Genotypen verantwortlich zu sein (vgl. Enomoto et al. 1995, J. Clin, invest 96, 224; 
Enomoto et al. 1996, N. Engi. J. Med. 334, 77; Gale Jr. et al. 1997, Virology 230. 217; Kaneko et al. 1994, Biochem. 
Biophys. Res. Commun. 205, 320; Reed et al., 1997, J. Virol. 71, 7187) und NS5B wurde als die RNA-abhSngige RNA 
Polymerase identifiziert. 

55 [0005] Anhand dieser Erkenntnisse wurden erste Diagnosesysteme entwickelt, die entweder auf dem Nachweis 
von HCV-spezifischen Antikorpern in Patientenserum oder auf dem Nachweis von HCV-spezifischer RNA mittels RT- 
PCR (= Reverse Transcription Polymerase Chain Reaction) beruhen, und die mittlerweile routine- und/oder vorschrifts- 
mSfSig bei alien Blutkonserven angewendet werden (mussen). 
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[0006] Seit der Erstbeschreibung des Genoms 1989 wurden mit Hilfe der PCR-Methode zahlreiche Teil- und Kom- 
plettsequenzen des HCV kloniert und charakterisiert. Ein Vergleich dieser Sequenzen zeigt eine hohe Variabilitat des 
viralen Genoms, insbesondere im Bereich des NS5B-Gens, was letztendlich zu einer Einteilung in 6 Genotypen gefOhrt 
hat, die selbst nochmals in Subtypen a, b, und c untergliedert sind. Die genomische Varianz ist nicht gleichmaftig uber 
5 das Genom verteilt. So sind die 5'NTR und Teile der 3*NTR hoch konserviert, wahrend bestimmte kodierende Sequen- 
zen z.T. sehr stark variieren, vor allem die HOIIproteine E1 und E2. 

[0007] Die klonierten und charakterisierten Teil- und Komplettsequenzen des HCV-Genoms wurden aufterdem hin- 
sichtlich geeigneter Angriffsziele fur ein prospektives antivirales Therapeutikum untersucht. Dabei wurden drei virate 
Enzyme gefunden, die sich als solches Angriffsziel anbieten. Diese sind (1) der NS3/4A Proteasekomplex, (2) die NS3 

10 Helikase und (3) die NS5B RNA-abhangige RNA Polymerase. Der NS3/4A Proteasekomplex und die NS3 Helikase 
konnten berelts kristallisiert und hinsichtlich ihrer dreidimensionalen Struktur aufgekiart werden (Kim et a!., 1996. Ceil, 
87,343; Yem et al., 1998, Protein Science, 7, 837; Love et al., 1996, Cell, 87, 31 1; Kim et al., 1998, Structure, 6. 89; Yao 
et al., 1997, Nature Structural Biology, 4, 463, Cho et al.„ 1998, J. Biol. Chem., 273, 15045); bei der NS5B RNA-abhan- 
gigen RNA Polymerase ist dies bis heute noch nicht gelungen. 

15 Obwohl mit diesen Enzymen bedeutsame Angriffsziele fur eine Therapieentwicklung der chronischen HCV-lnfektion 
definiert sind, und obwohl sowohl mit Hilfe von 'rational drug design' als auch mit Hilfe von 'high throughput screens' 
weltweit intensiv nach geeigneten Inhibitoren gesucht wird, leidet die Therapieentwicklung an einem groften Defizit, 
nfimlich dem Fehlen von Zellkultursystemen oder einfachen Tiermodellen, die es erlauben, HCV-RNA oder HCV-Anti- 
gene direkt, zuverlassig und mit einfachen laborOblichen Methoden nachzuweisen. Das Fehlen solcher Zellkultursy- 

20 steme ist auch der Hauptgrund dafur, daft das Verstandnis der HCV-Replikation bis heute noch sehr luckenhaft und in 
weiten Teilen nur hypothetisch ist. 

[0008] Obwohl nach Meinung der Fachwelt eine enge evolutionare Beziehung zwischen HCV und den Flavi- und 
Pestiviren besteht und fur diese autonom replizierende RNAs beschrieben sind, die in verschiedenen Zellinien ohne 
weiteres zur Replikation gebracht werden ktinnen und dabei relativ hohe Ausbeuten zeigen ( siehe Khromykh et al., 
25 1997, J. Virol. 71, 1497; Behrens et al., 1998, J.Virol. 72, 2364; Moser et al„ 1998, J. Virol. 72, 5318), waren ahnliche 
Versuche mit HCV bisher nicht erfolgreich. 

[0009] Zwar Ist aus verschiedenen Publikationen bekannt, dad Zellinien oder primSre Zellkulturen mit HCV-hatti- 
gem, hochtitrigem Patientenserum infiziert werden kbnnen, (Lanford et al. 1994, Virology 202, 606; Shimizu et al. 1993, 
Procedings of the National Academy of Sciences, USA, 90, 6037-6041; Mizutani et al. 1996, Journal of Virology, 70, 

30 7219-7223; M. Ikeda et al. 1998, Virus Res. 56, 157; Fournier et al. 1998, J. Gen. Virol. 79, 2376 und darin zitlerte Lite- 
raturstellen, Ito et al. 1996, Journal of General Virology, 77, 1043-1054), diese virusinfizierten Zellinien oder Zellkultu- 
ren erlauben jedoch nicht den direkten Nachweis von HCV-RNA oder HCV-Antigenen. Die virale RNA in diesen Zellen 
ist weder in einem Nothern-Blot (einem Standardverfahren zum quantitativen Nachweis von RNA) noch sind die viralen 
Protein in einem Western-Blot oder mittels Immunprazipitation detektierbar. Nur mit sehr aufwendigen und indirekten 

35 Methoden ist es uberhaupt gelungen, eine HCV-RepIikation nachzuweisen. Diese nachteiligen Umstande zeigen klar, 
daft die Replikation in diesen bekannten virusinfizierten Zellinien oder Zellkulturen absolut unzureichend ist. 
[0010] Desweiteren ist aus den Publikationen von Yoo et al. (1995, Journal of Virology, 69, 32-38) und von Dash et 
al., (1997, American Journal of Pathology, 151, 363-373) bekannt, daft Hepatomazellinien mit synthetischer HCV-RNA, 
die mittels in vitro Trankription von kioniertem HCV-Genom gewonnen wurde, transfiziert werden kflnnen. In beiden 

40 Publikationen gingen die Autoren von dem Grundgedanken aus, daft das virale HCV-Genom eine Plusstrang-RNA ist, 
die nach dem Elnschleusen in die Zelle direkt als mRNA fungiert, an die sich Ribosomen anheften und im Zuge von 
Translationsprozessen Virusproteine bilden, aus denen sich letztendlich neue HCV-Partikel bilden (kbnnen). Diese 
Virusreplikation, d.h. diese neu gebildeten HCV-Viren bzw. deren RNA wurde mittels RT-PCR nachgewiesen. Die publi- 
zierten Ergebnisse der durchgefuhrten RT-PCR sprechen jedoch daftir, daft die Effizienz der HCV-Replikation in den 

45 beschriebenen HCV-transfizierten Hepatomazellen nur sehr gering ist und jedenfalls nicht ausreicht, urn Schwankun- 
gen in der Replikationsrate nach gezielter Einwirkung mit prospektiven antiviralen Therapeutika auch nur qualitativ, 
geschweige denn quantitativ zu messen. Aufterdem ist im Stand der Technik mittlerweile bekannt (Yanagi et al., Proc. 
Natl. Acad. Sci. USA, 96, 2291-95, 1999), daft die hochkonservierte 3' NTR essentiell ist fOr die Virusreplikation, was 
in klarem Widerspruch zu den Behauptungen von Yoo et al. und Dash et al. stent, die fur ihre Versuche in Unkenntnis 

so des authentischen 3' Endes des HCV-Genoms ausschlieftlich HCV-Genome mit verkurzten 3' NTRs verwendet haben. 
[0011] Aufgabe der vorliegenden Erfindung ist die Bereitstellung eines HCV- Zellkultursystems, bei dem die virale 
RNA in den transfizierten Zellen autonom und mit so hoher Effizienz repliziert, daft Schwankungen in der Replikations- 
rate nach gezielter Einwirkung mit virus- und insbesondere HCV-spezifischen prospektiven antiviralen Therapeutika 
qualitativ und quantitativ und mit Hilfe gangiger, laborublicher Meftverfahren gemessen werden kfinnen. 

55 [0012] Eine Lfisung dieser Aufgabe besteht in der Bereitstellung eines Zellkultursystems der eingangs genannten 
Art, bei dem die eukaryontischen Zellen humane Zellen, insbesondere Hepatomazellen sind, die vorzugsweise von 
einer handelsOblichen Hepatomazellinie abstammen, aber auch aus einer entsprechenden Primarzellkultur gewonnen 
sein kflnnen, und bei dem das eingeschleuste HCV-spezifische Genmaterial ein HCV-RNA-Konstrukt ist, das im 
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wesentlichen die HCV-spezifischen RNA-Abschnitte 5' NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3' NTR, vorzugs- 
weise in der genannten Reihenfolge, und zudem wenigstens ein selektierbares Markergen (Selektionsgen) umfaftt. 
"NTR" steht hier und im folgenden fur "nicht-translatierte Region" und ist dem einschiagigen Fachmann als Begriff bzw. 
Abkurzung bekannt und gelaufig. Der Begriff "HCV-RNA-Konstrukt" umfaftt hier und im folgenden sowohl Konstrukte, 
5 die das komplette HCV-Genom enthalten, als auch solche, die ledigtich einen Teil davon, d.h. ein HCV-Subgenom ent- 
halten. 

Eine bevorzugte Variante des erfindungsgemSften Zellkultursystems, die sich in der Praxis sehr gut bewdhrt hat, ist 
unter der Nummer DSM ACC2394 (Laborbezeichnung HuBI 9-13) bei der DSMZ, Deutsche Sammlung von Mikroorga- 
nismen und Zellkulturen GmbH in Braunschweig, Deutschland, hinterlegt. 

10 [0013] Mit dem erfindungsgemSften Zellkultursystem wird erstmals ein in-vitro-System berelt gestellt, in dem HCV- 
RNA intrazellular, autonom und in ausreichend groften Mengen repliziert und exprimiert wird, so daft eine quantitative 
Bestimmung sowohl der HCV-RNA-Mengen als auch der HCV-spezifischen Proteine mit konventionellen und zuverlSs- 
sig genauen biochemischen Meftmethoden durchgefuhrt werden kann. Das heiftt: es steht erstmals ein annahemd 
authentisches zellgestutztes ("cell-based") HCV-Replikationssystem zur Verfugung, das fur die Entwicklung und Erpro- 

15 bung von antiviralen Pharmazeutlka dringend bentitigt wird. Dieses Testsystem bietet nun die Mflglichkeit, potentielle 
Angriffsziele fur eine wirksame HCV-spezifische Therapie zu Identifizieren und HCV-spezifische Chemotherapeutika zu 
entwickeln und zu evaluieren. 

[0014] Die Erfindung basiert auf der uberraschenden Erkenntnis, daft eine effiziente Replikation der HCV-RNA nur 
dann in Zellen stattfindet, wenn diese mit einem HCV-RNA-Konstrukt transfiziert wurden, das mindestens die 5' und die 

20 3' nicht-translatierten Regionen (NTR) und die Nichtstrukturproteine (NS) 3 bis 5B umfaftt und zusatzlich ein selektier- 
bares Markergen (Selektionsgen) aufweist. Offensichtlich sind die Strukturgene fur den Ablauf der Replikation ohne 
wesentliche Bedeutung, wahrend andererseits eine effiziente Replikation der HCV-RNA anscheinend nur dann stattfin- 
det, wenn die transfizierten Zellen einem permanenten Selektionsdruck unterzogen werden, der durch das mit der 
HCV-RNA verbundene selektierbare Markergen (Selektionsgen) vermittelt wird. Das Markergen (Selektionsgen) 

25 scheint somit einerseits die Selektion derjenigen Zellen zu provozieren, in denen die HCV-RNA produktiv repliziert, und 
andererseits scheint es die Effizienz der RNA-Replikation wesentlich zu steigern. 

[0015] Gegenstand der Erfindung ist auch ein zellfreies HCV-RNA-Konstrukt, das sich dadurch auszeichnet, daft 
es die HCV-spezifischen RNA-Abschnitte 5' NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3' NTR, vorzugsweise in der 
genannten Reihenfolge, und zudem ein selektierbares Markergen (Selektionsgen) umfaftt. 
so [0016] Der Begriff 5' NTR bzw. NS3 bzw. NS4A bzw. NS4B bzw. NS5A bzw. NS5B bzw. 3* NTR umfaftt im vorlie- 
genden Zusammenhang jede-Nukleotidsequenz, die im Stand der Technik als Nukleotidsequenz fur den jeweils betref- 
fenden funktionellen Abschnitt des HCV-Genoms beschrieben ist. 

[0017] Die Bereitstellung eines solchen HCV-RNA-Konstrukts ermdglicht erstmals eine detaillierte Analyse der 
HCV - Replikation, - Pathogenesis und - Evolution in Zellkulturen. Die HCV-spezifische virale RNA kann - als vollstan- 
35 diges Genom Oder als Subgenom - gezielt in beliebigen Mengen erzeugt werden, und es besteht die Mttglichkeit, das 
RNA-Konstrukt zu manipulieren und damit die HCV-Funktionen auf genetischer Ebene zu untersuchen und aufzukla- 
ren. 

[001 8] Da alle zur Zeit als Hauptangriffsziel fur eine Therapie untersuchten HCV-Enzyme, n^mlich die NS3/4A Pro- 
tease, die NS3 Hellkase und die NS5B Polymerase, in dem erfindungsgemSften HCV-RNA-Konstrukt enthalten sind, 

40. kann es fur alle entsprechenden Untersuchungen benutzt werden. 

[0019] Eine Ausfuhrungsform des HCV-RNA-Konstrukts, die sich in der praktischen Anwendung sehr gut bewShrt 
hat, zeichnet sich dadurch aus, daft sie die Nukleotidsequenz gemSft Sequenzprotokoll SEQ ID NO:1 umfaftt. 
Weitere Ausfuhrungsvarianten mit vergleichbar guten Eigenschaften fur den Einsatz in der Praxis sind dadurch 
gekennzeichnet, daft sie eine Nukleotidsequenz entweder gemaft Sequenzprotokoll SEQ ID NO:2 oder SEQ ID NO:3 

45 oder SEQ ID NO:4 oder SEQ ID NO:5 oder SEQ ID NO:6 oder SEQ ID NO:7 oder SEQ ID NO:8 oder SEQ ID NO:9 
Oder SEQ ID NO:10 oder SEQ ID NO:1 1 umfassen. 

[0020] Es besteht die MOglichkeit, das erfindungsgemafte HCV-Subgenom-Konstrukt mit einer 3' NTR zu verse- 
hen, die eine im Stand der Technik hierfOr bisher unbekannte Nukleotidsequenz aufweist, nQmlich eine Nukleotidse- 
quenz, die aus der Gruppe der nachfolgend aufgelisteten Nukleotidsequenzen (a) bis (i) ausgewdhlt ist: 

50 



55 
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(a) ACGGGGAGCTAAACACTC CAGG CCAATAGGCCATCCTG 1TT1TH1T1 1A 
GCTTTTTTTTTTTTCTTTTTTTTTGAGAGAGAGAGTCTCACTCTGTTGCCC 
AGACTGGAGT 

(b) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTC TTTTTTTTGA GAGAGAGAGT CTCACTCTGT 
TGCCCAGACT GGAGC 

(c) ACGGGGAGC TAAACACT CC AGGCCAAT AGGCCATCCTGTTTTTT 
TTTAATCTTT TTTTTTTTCT TTTTTTTTGA GAGAGAGAGT CTCACTCTGT 
TGCCCAGACT GCAGC. 

(d) ACC<KK5AGCTAAACACTCCAC<K:CAATAGGCCATCCTGTTTTTT 
T TTTTT AGTC TI T 11 ITTTT TCTTTTTTTT TGAGAGAGAG AGTCTCACTC 
TGTTGCCCAG ACTGGAGT 



(e) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 

25 TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG AGTCTCACTC 

TGTTGCCCAG ACTGGAGT 

(f) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 

so TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TTGAGAGAGA GAGTCTCACT 

CTGTTGCCCA GACTGGAGT 

(g) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
35 TTTTTAGTCT TTTTTTTTTT CTTTTTTTTT GAGAGAGAGA 

GTCTCACTCT GTTGCCCAGA CTGGAGT 

(h) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
40 TTTTTTTAAT CTTTTTTTTT TTTTTCCTTT TTTTGAGAGA 

GAGAGTCTCA CTCTGTTGCC CAGACTGGAG T 

(i) ACGCKKjAGCTAAACACTCCAGGCCAATAGGCCATCCTGlTTTTT 
, 5 TTTTTTAATC TTTTTTTTTT TTTTCTTTTT TTTTTGAGAG 

AGAGAGTCTC ACTCTGTTGC CCAGACTGGA GT 



Das In den erfindungsgemaiien HCV-RNA-Konstrukten enthaltene selektierbare Markergen (Selektionsgen) ist vor- 

50 zugsweise ein Resistenzgen, insbesondere eine Antibiotikumresistenzgen. 

Das hat den Vorteil, daft die mit diesem Konstrukt transfizierten Zellen leicht von den nicht transfizlerten Zellen selek- 
tiert werden konnen, indem dem Zellkutturmedium z.B. im Fall elnes Antibiotikumresistenzgens das betreffende Anti- 
blotikum zugegeben wird. Unter Antibiotikum' wlrd im vorliegenden Zusammenhang jede Substanz verstanden, die die 
nicht-transfizierten Wirtszellen Oder die Zellen, in denen die HCV-RNA nur mit geringer Effizienz repliziert, am Leben 

55 Oder Wachstum hindert, insbesondere Zellgifte wie z.B. Puromycin, Hygromycin, Zeocin, Bleomycin oder Blasticidin. 
[0021] Ein bevoizugtes selektierbares Markergen (Selektionsgen) bzw. Resistenzgen, das sich in der Praxis sehr 
gut bewahrt hat, ist das Neomycinphosphotransferasegen. 

[0022] Eine Alternative zu den Antibiotikumresistenzgenen ist z.B. das Thymidin-Kinase-Gen, mit dem eine HAT- 
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Selektion durchgefOhrt werden kann. 

[0023] Die Position des selektierbaren Markergens (Selektionsgens), bzw. des bevorzugten Resistenzgens bzw. 
des besonders bevorzugten Antibiotikumresistenzgens in dem HCV-RNA-Konstrukt liegt vorzugsweise hinter der HCV 
5' NTR, d.h. strangabwSrts der 5' NTR bzw. strangaufwgrts des HCV-Leserasters. Denkbar ist aber auch eine Insertion 

5 im Bereich der 3' NTR Oder an anderer Stelle des HCV-Genoms oder -Subgenoms, z.B. innerhalb des Polyproteins. 
[0024] Bei einer alternativen Ausfuhrungsform des erfindungsgemaften HCV-RNA-Konstrukts ist das selektierbare 
Markergen (Selektionsgen), insbesondere ein Antibiotikumresistenzgen, uber ein Ribozym bzw. eine Erkennungsstelle 
fur ein Ribozym mit der HCV-RNA bzw. der HCV-Genom- oder-Subgenomsequenz verbunden. 
[0025] Damit geht der Vorteil einher, daft nach erfolgter Selektion derjenigen Zellen, in denen die HCV-RNA pro- 

10 duktiv repliziert, in den daraus gewonnenen Zellklonen das Resistenzgen durch ribozymvermittelte Spaltung von der 
HCV-Subgenomsequenz abgetrennt werden kann, namlich durch Aktivierung des einklonierten Ribozyms oder, im Fall 
eines Konstrukts mit einer Erkennungsstelle fur ein Ribozym, durch Einschleusen des Ribozyms in die Zellen (z.B. mit- 
tels Transfektion eines Ribozymkonstrukts oder Infektion mit einem viralen Expressionsvektor, in den das entspre- 
chende Ribozym eingesetzt wurde). Auf diese Weise wird ein authentisches HCV-Genom-Konstrukt ohne 

is Resistenzgen erhalten, das zur Bildung authentischer infektiGser Viruspartikel befahigt ist. 

[0026] Eine weitere bevorzugte AusfOhrungsform des erfindungsgemSften HCV-RNA-Konstrukts zeichnet sich 
dadurch aus, dad das Konstrukt wenigstens ein integriertes Reportergen aufweist. 

[0027] Unter Reportergen wird im folgenden jedes Gen verstanden, dessen Anwesenheit sich nach Uberfuhrung 
in einen Zielorganismus leicht und im allgemeinen mit einfachen biochemischen oder auch histochemischen Methoden 
20 nachweisen laftt, d.h. das fGr ein Protein kodiert, welches auch in geringen Mengen einfach und zuveriassig mit den 
laborublichen Meftmethoden nachgewiesen und quantiflzlert werden kann. 

[0028] Diese Variante des HCV-RNA-Konstrukts hat den Vorteil, daft der Umfang der Replikation dieses Konstrukts 

anhand des Reportergenprodukts einfach und schnell mit laborublichen Methoden gemessen werden kann. 

[0029] Das Reportergen ist vorzugsweise ein Gen aus der Gruppe der Luziferasegene, dem CAT-Gen (Chloram- 

25 phenicol-Acetyl-Transferase-Gen), dem lacZ-Gen (beta-Galaktosidasegen), dem GFP-Gen (green-fiuorescence-pro- 
tein-Gen ), dem GUS-Gen (Glukuronidasegen) oder dem SEAP-Gen (Sezernerte-Alkalische-Phosphatase-Gen). 
Diese Reportergene bzw. deren Produkte, namlich die entsprechenden Reporterproteine, k6nnen z.B. mittels Fluores- 
zenz, Chemilumineszenz, colorimetrisch oder mit Hilfe immunologischer Methoden (z.B. ELISA) bestimmt werden. 
[0030] Als Reportergen kommt aber auch ein Surrogatmarkergen in Betracht. Darunter sind in diesem Zusammen- 

30 hang solche Gene zu verstehen, die fur zellulSre Proteine, NukleinsSuren oder — allgemein — fur solche Funktionen 
kodieren, die einer von der Virusreplikation abhangigen Variation unterliegen, und die infolgedessen in denjenigen Zel- 
len, in denen sich das HCV bzw. das HCV-RNA-Konstrukt vermehrt, entweder reprimiert oder aktiviert werden. Das 
heiftt: die Reduktion bzw. Aktivierung dieser Funktion ist ein Ersatzmarker fur die Virusreplikation bzw. die Replikation 
des HCV-RNA-Konstrukts. 

35 [0031] Die Positionen von Reportergen und selektierbarem Markergen (Selektionsgen) konnen so gewahlt sein, 
daft ein aus den beiden Genprodukten gebildetes Fusionsprotein exprimiert wird. Hierbei besteht die vorteithafte Mdg- 
lichkeit, daft diese beiden Gene so in dem HCV-RNA-Konstrukt angeordnet sind, daft ihre beiden exprimierten Proteine 
zunachst uber eine Schnittstelle fur eine Protease (z.B. Ubiquitin) oder uber ein selbstspaltendes Peptid (z.B. das 2A- 
Protein der Picornaviren) fusioniert sind und erst spSter proteolytisch wieder getrennt werden. 

40 Ebensogut kdnnen diese beiden Positionen aber auch derart getrennt voneinander liegen, daft beide Genprodukte 
separat exprimiert werden. (z.B. in der Reihenfolge: Marker- bzw. Resistenzgen — interne Ribosomenbindungsstelle 
— Reportergen). 

Im Fall des Reportergens hat sich eine AusfOhrungsvariante besonders bewahrt, bei der das Reportergen in das offene 
Leseraster des HCV-Genoms oder -Subgenoms einkloniert ist, und zwar derart, daft es erst nach einer proteolytischen 
45 Prozessierung in eine aktive Form uberfuhrt wird, 

[0032] Das erfindungsgemafte Zellkultursystem in alien seinen Variationen kann fur vielfaltige Zwecke eingesetzt 
werden. Diese umfassen: 

Das Auffinden antiviral wirksamer Substanzen. Dies kGnnen beispielsweise sein: organische Verbindungen, die 
so unmittelbar oder mittelbar in die Virusvermehrung eingreifen (z.B. Inhibitoren der viralen Proteasen, der NS3-Heli- 
kase, der NS5B RNA-abhangigen RNA Polymerase), anttsense Ollgonukleotide, die an eine belieblge Zielsequenz 
Innerhalb des HCV-RNA-Konstrukts (z.B. die 5' NTR) hybridisieren und unmittelbar oder mittelbar zu einer Beein- 
flussung der Virusvermehrung fuhren z.B. auf Grund einer Reduktion der Translation des HCV-Polyproteins oder 
Ribozyme, die eine beliebige HCV-RNA-Sequenz spalten und damit die Virusreplikation beeintrSchtigen. 
55 • Die Evaluierung jeglicher Art antiviral wirksamer Substanzen in Zellkultur. Solche Substanzen ktinnen beispiels- 
weise mittels 'rational drug design 4 oder 'high-throughput screening* am isolierten gereinigten Enzym gefunden 
werden. Unter Evaluierung sind vor allem die Bestimmung der inhibitorischen Eigenschaften der entsprechenden 
Substanz sowie deren Wirkungsmechanismus zu verstehen. 
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Die Identifikation neuer Angriffsziele, viralen oder zelluiaren Ursprungs, fur eine HCV-spezifische antivirale Thera- 
pie. 1st beispielsweise ein zelluiares Protein essentiell fur die Virusreplikation, kann mittels Hemmung dieses zellu- 
iaren Proteins die Virusreplikation ebenfalls beeinflufit werden. Das Auffinden solcher auxiliSren Faktoren ist mit 
dem erfindungsgemafcen System ebenfalls mbglich. 

5 • Der Einsatz fur die Resistenzbestimmung. Es ist anzunehmen, dafi auf Grund der hohen Mutationsrate des HCV- 
Genoms Therapieresistenzen auftreten. Solche Resistenzen, die gerade bei der klinischen Zulassung einer Sub- 
stanz von grower Bedeutung sind, lassen sich mit dem erfindungsgemSfien Zellkultursystem ermitteln. Zellinien in 
denen sich das HCV-RNA-Konstrukt bzw. das HCV-Genom oder - Subgenom repliziert, werden mit steigenden 
Konzentrationen der entsprechenden Substanz inkubiert und die Replikation der viralen RNA wird entweder 

10 anhand eines eingebrachten Reporters oder durch qualitative oder quantitative Bestimmung der viralen Nuklein- 
sfluren oder Proteine bestimmt. Resistenz ist dann gegeben, wenn bei normaler Wirkstoffkonzentration keine 
Hemmung der Replikation zu beobachten ist. Durch Reklonierung der HCV-RNA (z.B. mittels RT-PCR) und 
Sequenzanalyse k6nnen die fdrTherapieresistenz verantwortlichen Nukleotid- bzw. AminosSureaustausche ermit- 
telt werden. Durch Einklonieren der/des entsprechenden Austausche/s in das Ursprungskonstrukt kann deren 

is Kausalitat fur die Therapieresistenz bewiesen werden. 

Die Produktion von authentischen Virusproteinen (Antlgene) fur die Entwicklung und/oder Evaluierung von Diagno- 
stika. Das erfindungsgema&e Zellkultursystem erlaubt auch die Expression von HCV-Antigenen in Zellkulturen. 
Diese Antigene konnen prinzlpiell auch for den Aufbau diagnostischer Nachweisverfahren eingesetzt werden. 
Die Produktion von HCV Viren und virus-Shnlichen Partikeln insbesondere zur Entwicklung oder Herstellung von 

20 Therapeutika und Impfstoffen sowie fur diagnostische Zwecke. Insbesondere zellkultur-adaptierte vollstandige 
HCV-Genome, die mit dem erfindungsgemaften Zellkultursystem hergestellt werden kCnnen, sind in der Lage, mit 
hoher Effizlenz in Zellkulturen zu replizieren. Diese Genome besitzen alle Funktionen des HCV und sind deshalb 
in der Lage infektidse Viren zu produzieren. 

25 [0033] Das erfindungsgemafie HCV-RNA-Konstrukt fur sich genommen kann in alien seinen Variationen ebenfalls 
fur vielfaltige Zwecke eingesetzt werden. Dazu gehfiren vor allem: 

Die Konstruktion attenuierter Hepatitis C Viren bzw. HCV-ahnlicher Partikel und deren Produktion In Zellkulturen: 
Durch zufailige odergezielt hervorgerufene Mutationen, beispielsweise Punktmutationen, Deletionen oder Insertio- 
30 nen, kfinnen attenuierte HCV- oder HCV-Shnliche Partikel erzeugt werden, d.h. Viren bzw. virusahnliche Partikel 
mit volier Replikatioriskompetenz aber verringerter bzw. fehlender Pathogenitat. Solche attenuierte HCV- oder 
HCV-ahnliche Partikel sind insbesondere als Impfstoff einsetzbar. 

Die Konstruktion von HCV-RNA-Konstrukten mit integrierten Fremdgenen, beispielsweise zur Verwendung als 
leberzellspezifische Genfahren in der Gentherapie. Auf Grund des ausgeprSgten Leberzelltropismus des HCV und 

35 der MOglichkeit, Teile des Genoms durch heterologe Sequenzen zu ersetzen, lassen sich HCV-RNA-Konstrukte 
herstellen, bei denen beispielsweise die Strukturproteine durch ein therapeutisch wirksames Gen ersetzt werden. 
Das so erhaltene HCV-RNA-Konstrukt wird in Zellen eingeschleust, vorzugsweise mittels Transfektion, die die feh- 
lenden HCV-Funktionen, beispielsweise die Struturproteine, konstitutiv oder induzierbar exprimieren. Durch diese 
dem Fachmann unter dem Begriff der Transkomplementation' bekannte Technik lassen sich Viruspartikel erzeu- 

40 gen, in die das HCV-RNA-Konstrukt eingebaut wird. Die so erhaitenen Partikel kflnnen fOr die Infektion vorzugs- 
weise von Leberzellen verwendet werden. In diesen wird das therapeutisch wirksame Fremdgen zur Expression 
gebracht und entfaltet damit seine therapeutische Wirkung. 

Das Auffinden permissiver Zellen, d.h. Zellen, in denen eine produktive Virusvermehrung erfolgt. Zu diesem Zweck 
wird entweder eines der vorgenannten HCV-RNA-Genomkonstrukte verwendet, das zur Bildung kompletter infek- 

45 tiaser Viren befahigt ist, oder es wird eines der vorgenannten HCV-Subgenom-Konstrukte eingesetzt, das aller- 
dings zunachst gemafl vorgenanntem Beispiel in eine Zellinie transfiziert wird, die die fehlenden Funktionen 
konstitutiv oder induzierbar exprimiert. In all diesen Fallen entstehen Viruspartikel, die zusatzlich zur HCV- 
Sequenz ein Resistenz- und/oder Reportergen tragen. Zum Auffinden von Zellen, in denen das HCV replizieren 
kann, werden diese Zellen mit den so hergestellten Viren infiziert und einer Antibiotikumselektion unterzogen oder, 

50 In Abhangigkeit vom HCV-RNA-Konstrukt, mittels Nachweis der Expression des Reportergens untersucht. Da eine 

Antibiotikumreslstenz bzw. eine Expression des Reportergens nur dann nachweisbar 1st, wenn das HCV-RNA-Kon- 
strukt repliziert, mussen die so gefundenen Zellen permissiv sein. Auf diese Weise lassen sich nahezu beliebige 
Zellinien oder primare Zellkulturen hinsichtlich der Permissivitat testen und auffinden. 

55 [0034] Das erfindungsgemafie Zellkultursystem erlaubt auch das gezielte Auffinden von HCV-RNA-Konstrukten, 
bei denen es auf Grund von Mutationen, die sich entweder zufailig im Rahmen der HCV-RNA-Replikation ereignen 
oder die gezielt in das Konstrukt eingefUhrt werden, zu einer Steigerung der Replikationseffizienz kommt. Solche Muta- 
tionen, die zu einer VerSnderung der Replikation des HCV-RNA-Konstrukts fuhren, sind dem Fachmann als adaptive 
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Mutationen bekannt. Die Erfindung umfaftt deshalb auch Verfahren zur Gewinnung von zellkultur-adaptierten Mutanten 
eines erfindungsgemaften HCV-RNA-Konstrukts gemaft vorstehender Beschreibung, wobel die Mutanten gegenOber 
dem originSren HCV-RNA-Konstrukt eine erhtihte Replikationseffizienz aufweisen. Sie umfaftt desweiteren ein Verfah- 
ren zur Herstellung von Mutanten eines HCV-RNA-Voliangengenoms Oder eines HCV-RNA-Teilgenoms Oder eines 
5 beliebigen HCV-RNA-Konstrukts mit im Vergleich zu dem ursprunglichen HCV-RNA-Voliangengenom oder -Teilgenom 
Oder HCV-RNA-Konstrukt erhohter Replikationseffizienz, sowie zeilkultur-adaptierte Mutanten von HCV-RNA-Kon- 
strukten, HCV-Voliangengenomen und HCV-Teilgenomen mit im Vergleich zu den ursprunglichen Konstrukten, Teil- 
oder Vollangengenomen erhohter Replikationseffizienz. 

[0035] Das erfindungsgemafte Verfahren zur Gewinnung von zellkultur-adaptierten Mutanten eines erfindungs- 
w gemaften HCV-RNA-Konstrukts, wobei die Mutanten gegenuber dem HCV-RNA-Konstrukt eine erhehte Replikations- 
effizienz aufweisen, ist dadurch gekennzeichnet, daft man ein Zellkultursystem gemaft Anspruch 1, bei dem das 
eingeschleuste HCV-spezifische Genmaterial ein HCV-RNA-Konstrukt mit Selektionsgen nach einem der Anspruche 4 
bis 19 ist, auf/in dem dem Selektionsgen entsprechenden Selektionsmedium kultiviert, daft man die gewachsenen Zell- 
klone erntet, und daft man aus diesen Zellklonen die HCV-RNA-Konstrukte isoliert. 
15 [0036] Bei einer vorteilhaften Weiterbildung dieses Herstellungsverfahrens werden die isolierten HCV-RNA-Kon- 
strukte wenigstens einmal erneut passagiert, nSmlich in Zellen eines Zellkultursystems nach Anspruch 1 einge- 
schleust, das dabei erhaltene Zellkultursystem gemaft Anspruch 1, bei dem das eingeschleuste HCV-spezifische 
Genmaterial das isolierte HCV-RNA-Konstrukt mit Selektionsgen ist, auf/in dem dem Selektionsgen entsprechenden 
Selektionsmedium kultiviert, die gewachsenen Zellklone geerntet und daraus die HCV-RNA-Konstrukte isoliert. 
20 Mit dieser Verfahrensvariante kann der Grad der adaptiven Mutationen und damit der Grad der Replikationseffizienz in 
den betreffenden HCV-RNA-Konstrukten noch gestelgert werden. 

[0037] Das erfindungsgemafte Verfahren zur Herstellung von Mutanten eines HCV - VoIISngengenoms oder eines 
HCV- Teilgenoms oder eines beliebigen HCV-RNA-Konstrukts mit im Vergleich zu dem ursprunglichen HCV- VollSngen- 
genom oder - Teilgenom oder HCV-RNA-Konstrukt erhGhter Replikationseffizienz zelchnet sich dadurch aus, daft man 

25 mit Hilfe eines der beiden vorstehend genannten Herstellungsverfahren eine zeilkultur-adaptierte Mutante eines HCV- 
RNA-Konstrukts herstellt, diese aus den Zellen isoliert, mit im Stand der Technik bekannten Methoden klonlert und 
sequenziert und durch Vergleich mit der Nukleotid- und AmlnosSuresequenz des ursprunglichen HCV-RNA-Konstrukts 
die Art, Anzahl und Positionen der Mutationen bestimmt, und diese Mutationen dann entweder durch gezielte Mutage- 
nese oder durch Austausch von Sequenzabschnitten, welche die betreffenden Mutationen enthalten, in ein (isoliertes) 

30 HCV-VollSngen- oder -teilgenom oder ein beliebiges HCV-RNA-Konstrukt einfuhrt. 

Zum Nachweis bzw. zur Verifizierung derjenigen Mutationen, die tatsSchlich eine Veranderung der Repllkation und ins- 
besondere eine Replikationssteigerung bewirken, kann ein Test durchgefOhrt werden, bei dem die bestimmten Nukleo- 
tid- und/oder Aminosaureaustausche in das ursprOngliche HCV-RNA-Konstrukt eingefuhrt und dieses wiederum in 
Zellkultur eingeschleust wird. Wenn die eingefuhrte Mutation tatsachlich zu einer Steigerung der Replikation fuhrt, 

35 sollte im Fall eines HCV-RNA-Konstrukts mit selektierbarem Markergen die Zahl der resistenten Zellklone bei dem 
kunstlich mutierten Konstrukt deutlich hoher sein als bei dem unbehandelten Konstrukt. Im Fall eines Konstrukts mit 
einem Reportergen sollte die Aktivitat bzw. Menge des Reporters bei dem kunstlich mutierten Konstrukt deutlich hOher 
sein ais bei dem unbehandelten. 

[0038] Die erfindungsgemaften zellkultur-adaptierten HCV-RNA-Konstrukte mit hoher Replikationseffizienz sind 
40 dadurch gekennzeichnet, daft sie durch Nukleotid- und/oder Aminosaureaustausche von einem HCV-RNA-Konstrukt 
nach einem der Anspruche 4 bis 19 ableitbar sind und daft sie mit einem der beiden vorstehend genannten Herstel- 
lungsverfahren erhSltlich sind. 

[0039] Diese zellkultur-adaptierten HCV-RNA-Konstrukte kbnnen dazu verwendet werden, beliebige HCV-RNA- 
Konstrukte oder HCV-Vollangen- oder Teilgenome mit erhohter Replikationseffizienz herzusteilen. Dabei kSnnen 
45 sowohl Konstrukte mit einem selektierbaren Resistenzgen als auch Konstrukte ohne ein solches bzw. mit einem nicht- 
selektierbaren Reportergen (z.B. Luziferase) hergestellt werden, denn aufgrund der sehr hohen Replikationseffizienz 
des zellkultur-adaptierten HCV-RNA-Konstrukts kann dessen Replikation auch in nicht-selektionierten Zellen nachge- 
wiesen werden. 

Die erfindungsgemaften zellkultur-adaptierten Mutanten eines HCV-RNA-Konstrukts oder eines HCV-Voliangenge- 
50 noms oder eines HCV-Teilgenoms mit im Vergleich zu dem ursprunglichen HCV-RNA-Konstrukt oder dem ursprungli- 
chen HCV-Voliangengenom erhohter Replikationseffizienz , sind dadurch charakterisiert, daft sie mit einem Verfahren 
erhaltlich sind, bei dem man in einem zellkultur-adaptierten HCV-RNA-Konstrukt durch Sequenzanalyse und Sequenz- 
vergleich die Art und Anzahl der Mutationen bestimmt und diese Mutationen in ein HCV-RNA-Konstrukt, Insbesondere 
in ein HCV-RNA-Konstrukt gemaft einem der Anspruche 4 bis 19, Oder in ein (isoliertes) HCV-RNA-Voliangengenom 
55 einfOhrt, entweder durch gezielte Mutagenese oder durch Austausch von Sequenzabschnitten, die die betreffenden 
Mutationen enthalten. 

[0040] Eine Gruppe ganz bevorzugter HCV-RNA-Konstrukte, HCV-Voliangengenome und HCV-Teilgenomen mit 
hoher und sehr hoher Replikationseffizienz und infolgedessen sehr guter Eignung fur die praktische Anwendung ist 
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dadurch gekennzeichnet, dali sie einen oder mehrere Oder alle der in Tabelle 3 aufgelisteten AminosSure- bzw. Nukleo- 
tidaustausche und/oder einen oder mehrere der folgenden Aminosaureaustausche aufweist: 1283 arg -> gly , 1383 glu 
-> ala , 1577 lys -> arg , 1609 tys -> glu , 1936 pro -> ser . 2163 glu -> gly , 2330 lys -> glu , 2442 ile -> val. (Die Zahlen 
beziehen sich auf die Aminosaurepositionen des Poiyproteins des HCV-lsolats conl, siehe Tabelle 1). 

5 

Besondere Eigenschaften der in den Sequenzprotokollen angegebenen Sequenzen: 

SEQ ID-NO: 1 

10 [0041] 

Name: !389/Core-37wt 
Aufbau (Nukleotidpositionen): 

15 1 . 1 -341 : HCV 5* nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus: erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

20 4. 1813-10842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B 

5. 1813-2385: HCV Core Protein; Strukturprotein 

6. 2386-2961: HOIIprotein 1 (envelope protein 1); Strukturprotein 

7. 2962-4050: HOIIprotein 2 (envelope protein 2); Strukturprotein 

8. 4051-4239: Protein p7 

25 9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891-6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

1 1 . 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

13. 7729-9069: Nichtstrukturprotein 5A (NS5A) 

30 14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 

15. 10846-1 1076: HCV 3* nicht-translatierte Region 

SEQ ID-NO: 2 

35 [0042] 

Name: !337/NS2-37wt 
Aufbau (Nukleotidpositionen): 

40 1 . 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1181: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1190-1800: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

45 

4. 1801-8403: HCV Polyprotein von Nichtstrukturprotein 2 bis Nichtstrukturprotein 5B 

5. 1801-2451: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

6. 2452-4344: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

7. 4345-4506: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 
so 8. 4507-5289: Nichtstrukturprotein 4B (NS4B) 

9. 5290-6630: Nichtstrukturprotein 5A (NS5A) 

10. 6631-8403: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 

11. 8407-8637: HCV 3' nicht-translatierte Region 
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SEQ ID-NO: 3 
[0043] 

5 Name: l389/NS3-37wt 

Aufbau (Nukleotidpositionen): 

1. 1-341: HCV 5' nicht-translatierte Region 

2. 342-1193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

io 3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 

dahinterllegenden HCV offenen Leserasters 

4. 1813-7767: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B 

5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 
15 6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 

8. 4654-5994: Nichtstrukturprotein 5A (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abhSngige RNA-Polymerase 

10. 7771-8001: HCV 3* nicht-translatierte Region 

20 

SEQ ID-NO: 4 
[0044] 

25 Name: l337/NS3-37wt 

Aufbau (Nukleotidpositionen): 

1 . 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1181: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

30 3. 1190-1800: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 

dahinterliegenden KCV offenen Leserasters 

4. 1801-7758: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B 

5. 1801-3696: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 
35 6. 3697-3858: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

7. 3859-4641: Nichtstrukturprotein 4B (NS4B) 

8. 4642-5982: Nichtstrukturprotein 5A (NS5A) 

9. 5983-7755: Nichtstrukturprotein 5B (NS5B); RNA-abhSngige RNA-Polymerase 

10. 7759-7989: HCV 3' nicht-translatierte Region 

40 

SEQ ID-NO: 5 
[0045] 

45 Name: l389/NS2-37wt 

Aufbau (Nukleotidpositionen): 

1. 1-341: HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 
so 3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 

dahinterliegenden HCV offenen Leserasters 

4. 1813-8418: HCV Polyprotein von Nichtstrukturprotein 2 bis Nichtstrukturprotein 5B 

5. 1813-2463: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 
55 6. 2464-4356: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

7. 4357-4518: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

8. 4519-5301: Nichtstrukturprotein 4B (NS4B) 

9. 5302-6642: Nichtstrukturprotein 5A (NS5A) 
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10. 6643-8415: Nichtstrukturprotein 5B (NS5B); RNA-abhSngige RNA-Potymerase 

11. 8419-8649: HCV 3' nicht-translatierte Region 

SEQ ID-NO: 6 

5 

[0046] 

Name: I389/NS3-379-13F 
Aufbau (Nukleotidpositionen): 

w 

1. 1-341: HCV 5' nicht-translatierte Region 

2. 342-1193: HCV Core Proteln-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

is 4. 1813-7767: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B der zellkultur-adaptier- 

ten Mutante 9-1 3F 

5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 
20 7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 

8. 4654-5994: Nichtstrukturprotein 5A (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 7771-8001: HCV 3' 
nicht-translatierte Region 

25 SEQ ID-NO: 7 

[0047] 

Name: l389/Core-379-13F 
30 Aufbau (Nukleotidpositionen): 

1. 1-341: HCV 5' nicht-translatierte Region 

2. 342-1193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
35 dahinterliegenden HCV offenen Leserasters 

4. 1813-10842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B der zellkultur-adaptierten Mutante 9-13F 

5. 1813-2385: HCV Core Protein; Strukturprotein 

6. 2386-2961: Hullprotein 1 (envelope protein 1); Strukturprotein 
ao 7. 2962-4050: Hullprotein 2 (envelope protein 2); Strukturprotein 

8. 4051-4239: Protein p7 

9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891-6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

11 . 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 
45 12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

13. 7729-9069: Nichtstrukturprotein 5A (NS5A) 

14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 

15. 10846-11076: HCV 3' nicht-translatierte Region 

so SEQ ID-NO: 8 

[0048] 

Name: I389/NS 3-375.1 
55 Aufbau (Nukleotidpositionen): 

1. 1-341: HCV 5' nicht-translatierte Region 

2. 342-1193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 
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3. 1202-1812: Interne Ribosomenbindungsstelie des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterllegenden HCV offenen Leserasters 

4. 1813-7767: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B der zellkultur-adaptier- 
ten Mutante 5.1 

5 

5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 

8. 4654-5994: Nichtstrukturprotein 5B (NS5A) 

w 9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abhzingige RNA-Polymerase 7771-8001: HCV 3* 

nicht-translatierte Region 

SEQ ID-NO: 9 

15 [0049] 

Name: !389/Core-375.1 
Aufbau (Nukleotidpositionen): 

20 1 . 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1193: HCV Core Protein-Neomycln Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelie des Encephalomyokarditis Virus: erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-10842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B der zellkultur-adaptierten Mutante 5.1 

25 

5. 1813-2385: HCV Core Protein; Strukturprotein 

6. 2386-2961: Hullprotein 1 (envelope protein 1); Strukturprotein 

7. 2962-4050: Hullprotein 2 (envelope protein 2); Strukturprotein 

8. 4051-4239: Protein p7 

30 9, 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891 -6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

1 1 . 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

13. 7729-9069: Nichtstrukturprotein 5A (NS5A) 

35 14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhSnglge RNA-Polymerase 

15. 10846-11076: HCV 3' nicht-translatierte Region 

SEQ ID-NO: 10 

40 [0050] 

Name: I389/NS3-3719 
Aufbau (Nukleotidpositionen): 

45 1 . 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycln Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelie des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-7767: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B der zellkultur-adaptier- 
50 ten Mutante 19 

5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 
55 8. 4654-5994: Nichtstrukturprotein 5A (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abh3ngige RNA-Polymerase 7771-8001: HCV 3' 
nicht-translatierte Region 



12 



EP 1 043 399 A2 



SEQ ID-NO: 11 
[0051] 

5 Name: !389/Core-3719 

Aufbau (Nukleotidpositionen): 

1, 1-341: HCV 5' nicht-translatierte Region 

2. 342-1193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

10 3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 

dahinterliegenden HCV offenen Leserasters 

4. 1813-10842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B der zellkultur-adaptierten Mutante 19 

5. 1813-2385: HCV Core Protein; Strukturprotein 
15 6. 2386-2961: HQIIprotein 1 (envelope protein 1); Strukturprotein 

7. 2962-4050: HQIIprotein 2 (envelope protein 2); Strukturprotein 
8.4051-4239: Protein p7 

9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891-6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 
20 11. 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

13. 7729-9069: Nichtstrukturprotein 5A (NS5A) 

14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 

15. 10846-1 1076: HCV 3' nicht-translatierte Region 

25 

[0052] Die Erfindung wird im folgenden anhand von Ausfuhrungsbeispielen und dazugeh6rigen Tabellen und Figu- 
ren naher erlSutert. Die erwfihnten Figuren zeigen 

Fig. 1 A: Die Struktur eines erfindungsgemafcen HCV-RNA-Konstrukts Ganz oben ist eine schematische Darstel- 
30 lung der Struktur des kompletten parentalen HCV-Genoms gegeben mit den Positionen der Gene fur die 

Spaltungsprodukte core, E1, E2, p7, NS2, NS3, NS4A, NS4B, NS5A und NS5B innerhalb des Polypro- 
teins, und den 5' und 3' nichttranslatierten Regionen (5' NTR und 3' NTR) — als Horizontalbalken darge- 
stellt — , und mit den belden for die Erzeugung der Subgenom-Konstrukte ausgewdhlten Positionen, 
namlich der Position der *GDD-katalytischen Domane* der NS5B RNA Polymerase (GDD) und der Posi- 
35 tion der 3' Grenze der HCV-IRES (Nukleotidpositionen 1 bis 377 bzw. 1 bis 389) — oberhalb des Genom- 

schemas eingezeichnet — . Die Zahlen unterhalb des Genomschemas bezeichnen die entsprechenden 
Nukleotidpositionen. 

Darunter sind schematische Darstellungen der Strukturen zweier erfindungsgemafter, modifizierter 
HCV-RNA-Konstrukte (Subgenom) gezeigt, bestehend aus der 5' HCV-IRES, dem Neomycinphospho- 
40 transferasegen (Neo R ), der EMCV-IRES (E-l) und den HCV Sequenzen von NS2 bzw. NS3 bis zum 

authentischen 3' Ende. Die Position der das NS5B Polymerase GDD-Motiv umfassenden 10 AminosSu- 
ren-Deletion ist jeweils mit einem Dreieck (A) markiert. 

Fig. 1 B: Das Ergebnis einer denaturierenden Formaldehyd-Agarose-Gelelektrophorese zum Nachweis von repli- 
es zierter Plusstrang-RNA in transfizierten subpassagierten Huh-7 Zellklonen. 

Die Positionen der HCV-spezifischen RNAs (Pfeile) und der 28S rRNA sind rechts von Spur 12 angege- 
ben, die Grfifien (Anzahlen der Nukleotide) der RNA-Marker (M) sind links von Spur 1 angegeben. 

Fig. 1 C : Das Ergebnis eines PCR-Tests mit nachfolgendem Southern-Blot zum Nachweis der Abwesenheit von 
so integrlerter Replikon-DNA in den melsten der selektierten Zellklone. 

Spuren 1 und 2 zeigen die Positivkontrollen, Spur 13 die Negativ-Kontrolle. Die Zahlenangaben links der 
Spur 1 bezeichnen die Gr6lie der Nukleotid-Marker-MolekOle. 

Fig. 2 A: Das Ergebnis eines PCR-Tests mit nachfolgendem Southern-Blot zum sensitiven Ausschlufi integrierter 
55 Replikon-DNA (Plasmid Molekule l 3 77/NS3-3'/wt) in einem HCV-RNA-Konstrukt-haltigen Zellklon (9-1 3). 

Die Spuren 7 bis 11 reprasentieren das Ergebnis einer Titration von DNA-Molekulen des Konstrukts 
l 3 77/NS3-3Vwt ohne Zugabe von Gesamt-DNA des Zellklons 9-13 und die Spuren 2 - 6 reprasentieren 
die gleichen Plasmidmolekule mit Zugabe von jeweils 1 ug 9-1 3 DNA vor der PCR (zwecks Ausschlufi 
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eines Inhibitors der PCR in der DNA-Pra pa ration). Spur 13 reprSsentiert die Negativ-Kontrolle (PCR 
ohne DNA-Sonde). Spur 1 zeigt das Ergebnis, das mit einem ug Gesamt-DNA des Zellkons 9-13 erhal- 
ten wurde. 

5 Fig. 2 B: Das Ergebnis eines Northern-Blot-Tests zur Quantifizierung von HCV Plus- und Minusstrang RNA. 

Die Pfeile markieren die Positionen von Replikon-RNA. Die "plus" und "minus" -Abgaben bezeichnen die 
positive (plus) bzw. negative (minus) Polaritat der RNA-Kontrollen, die auf das Gel aufgetragen wurden. 
"Minusstrand" und "Plusstrand" bezeichnen die Spezifitat der radioaktiven RNA-Sonden. 

w Fig. 2 C: Ergebnis einer Formaldehyd-Agarose-Gelelektrophorese nach radioaktiver Markierung der intrazellulfir 
replizierten HCV-RNA zum Nachweis der Resistenz der HCV-RNA-Replikation gegen Dactinomycin. 

Fig. 3 A: Nachweis von HCV-spezifischen Antigenen in den selektierten Zellklonen mittels ImmunoprSziprtation 
nach metabolischer Radioaktivmarkierung. Die Spuren 7 - 9 reprSsentieren authentische Grfilienmarker 
15 (die nach transienter Expression eines HCV-RNA-Konstrukts in Huh-7-Zellen erhalten wurden); identifi- 

zierte HCV-Proteine sind am linken Rand von Spur 1 markiert, die Molekulargewichte (in Kilodalton) sind 
am rechten Rand von Spur 9 angegeben. 

Fig. 3 B: Ergebnisse eines Immunfluoreszenztests zum Nachweis der subzellularen Lokalisation von HCV Antige- 
20 nen. 

Fig. 4: Schematische Darstellung der Struktur eines erfindungsgemSlien selektierbaren HCV-RNA-Konstrukts 

(komplettes Genom) bestehend aus der 5' HCV-IRES, dem Neomycinphosphotransferasegen (NeoR), 
einem heterologen IRES-Element, z.B. des Encephalomyocarditisvirus (E-l), dem votlstSndigen HCV- 
25 Leseraster und der authentischen 3* NTR. 

Fig. 5: Schematische Darstellung der Struktur von HCV-RNA-Konstrukten mit insertiertem Antibiotikumresi- 

stenzgen (A) innerhalb der fur das Polyprotein kodierenden Nukleotidsequenz (monocistronische RNA). 
und (B) innerhalb der 3' NTR (bicistronische RNA). 

30 

Fig. 6: SchematischeDarstellung der Struktur von HCV-RNA-Konstrukten mit insertiertem Reportergen (A) als 

Teil eines HCV-Repfikons von NS3 bis NS5B; — das Reporterprotein wird letztendlich durch virale Oder 
durch zelluiare Proteasen aus dem Polyprotein gespalten und das selektierbare Markergen (Selektions- 
gen) bzw. das Resistenzgen durch Kontransfektion in die Zellen einschleust , (B) als Teil eines Fusions- 

35 gens aus Resistenz- und Reportergen (z.B. fur die Neomycinphosphotransferase und green fluorescent 

Protein) (C) als Teil eines Replikons aus Resistenz- und Reportergen (z.B. fur die Neomycinphospho- 
transferase und das green fluorescent Protein), die uber eine Nukleotidsequenz verbunden sind, welche 
fur eine AminosSuresequenz kodiert (schraffierter Bereich), die von einer Protease gespalten werden 
kann oder die uber eine sefbstspaltende (autokatalytische) AktivitSt verfugt, (D) als unabhangiges Gen 

40 (hier green fluorescent protein), das von einer eigenen internen Ribosomenbindungsstelle (IRES) aus 

exprimiert wird; — das Resistenzgen (hler: Neomycinphosphotransferase-Gen) wird davon unabhangig 
ebenfalls von einer eigenen internen Ribosomenbindungsstelle (IRES) aus exprimiert (polycistronisches 
Konstrukt). 

45 Fig. 7: Schematische Darstellung der Struktur eines HCV-RNA-Konstrukts bei dem das Resistenzgen uber ein 

Ribozym bzw. eine Erkennungsstelle fur ein Ribozym mit der HCV-RNA-Sequenz verbunden ist. Die dik- 
ken Linien stellen die HCV 5' und 3' NTRs dar, E-l ist eine heterologe interne Ribosomenbindungsstelle, 
die fur die Expression des Resistenzgens notwendig ist, und das graue Quadrat stellt das Ribozym bzw. 
eine Erkennungsstelle fur ein Ribozym dar. 

50 

Fig. 8: Schematische Darstellung der Struktur eines HCV-RNA-Konstrukts mit Resistenzgen und integriertem 

Fremdgen. 

Fig. 9: Methodisches Vorgehen zum Vergleich der spezifischen Infektiositat (ausgedruckt als Anzahl gebildeter 

55 Zellkolonlen) von Gesamt-RNA versus in vitro Transkripte. HCV-RNA wird mittels in vitro Transkription 

eines entsprechenden RNA-Konstrukts hergestellt und durch Messung der optischen Dichte bei 260 nm 
(OD 260 nm) quantifiziert. Eine definierte Anzahl dieser MolekOle wird mit einer bestimmten Menge 
Gesamt-RNA von naiven Huh-7 Zellen gemischt und diese Mischung mit Hilfe der Elektroporation in 
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naive Huh-7 Zellen eingeschleust. Parallel dazu wird die Gesamt-RNA eines Zellklons, der mit der in 
Figur 1 beschrlebenen Methode hergestellt wurde, mlt einem im Stand der Technik bekannten Verfahren 
jsoliert und die Menge der darln enthaltenen HCV-RNA mittels Northern-blot unter Verwendung einer 
HCV-spezifischen RNA-Sonde und anschliefiender Quantifizierung mittels Phospholmager bestimmt. 

5 Eine definierte Menge dleser Gesamt-RNA wird analog den in vitro Transkripten in naTve Huh-7 Zellen 

transfiziert. Diese Zellen in beiden Ansatzen werden danach einer G418-Selektion unterzogen und die 
Anzahl der gebildeten Kolonien durch Auszahlen nach fixieren und anfSrben mlt Coomassie-Brilliant- 
Blau bestimmt. Zur Bestimmung der Transfektionseffizienz wird jedem Transfektionsansatz 1u.g eines 
Plasmids zugesetzt, das die Expression der Luziferase erlaubt. Ein Aliquot der transfizierten Zellen wird 

10 nach 24 Stunden geerntet und die Luziferaseaktivitat im jeweiligen Zellysat bestimmt. Die Anzahl der 

Kolonien wird jewells auf die Luziferaseexpression normiert. 

Fig. 10: Sequenzanaiyse der 9-13 Klone. Gesamt-RNA des Zellklons 9-13, der durch Transfektion des HCV- 
RNA-Konstrukts I377/NS3-3* entstand, wurde mit einem im Stand der Technik bekannten Verfahren iso- 
15 liert und das HCV-RNA-Konstrukt von Nukleotidposition 59 bis 9386 mit Hilfe der 'long-distance RT-PCR* 

unter Verwendung der primer S59 und A9413 amplizifiert. Die PCR-Fragmente wurden kloniert und 11 
Klone (genannt 9-13 A - K) vollstandig sequenziert, wobei sich die Klone D und I, E und G sowie H und 
J als identisch erwiesen. Die Positionen der Aminosaureunterschiede in der NS3-5B Region zwischen 
den reklonierten HCV-RNAs und dem parentalen Konstrukt sind mit einem dicken vertikalen Strich beim 
20 jeweiligen Klon markiert. Jeder Klon wurde mit dem Restriktionsenzym Sfi 1 verdaut und das jeweilige 

Fragment in das parentale Konstrukt inseriert. Diese Klone wurden jeweils in Huh-7 Zellen transfiziert 
und die Zellen wie in Figur 1 beschrieben einer Selektion unterzogen. Die Anzahl der mit jedem Kon- 
strukt erhattenen Zellklone ist rechts neben dem jeweiligen Konstrukt vermerkt. 

Prinzip der Replikationsbestimmung mit Hilfe eines Reportergens. Im oberen Teil der Figur ist das HCV- 
DNA-Konstrukt l3 8 9/Luc/NS3-3* dargestellt, bestehend aus der HCV 5' NTR (Nukleotidposition 1-389), 
dem Luziferasegen (/uc), der IRES des Encephalomyocarditis Virus, dem HCV NS3-5B und der 3* NTR. 
Die Position des aktiven Zentrums der NS5B RNA-Polymerase, in das ein inaktivlerender Aminosaure- 
austausch eingefOhrt wurde, ist mit 'GND* angedeutet. Die Plasmide, die fur das replikationskompetente 
bzw. das defekte HCV-RNA-Konstrukt kodleren, werden mit dem Restriktionsenzym Sea I verdaut und 
in eine in vitro Transkription mit der T7 RNA-Polymerase eingesetzt. Nach Entfernung der Matrizen-DNA 
werden die jeweiligen HCV-RNA-Konstrukte mittels Elektroporation in naive Huh-7 Zellen eingeschleust 
und diese in regelmSlilgen Abstanden geerntet. 

35 Fig. 11 B: Vergleich der LuziferaseaktivitSten in Zellen transfiziert mit dem parentalen HCV-RNA-Konstrukt 
l 389 /Luc/NS3-37wt (wt) oder den folgenden Varianten: Der inaktiven RNA (318 DN), der Variante 9-1 3F 
Oder der Variante 5.1. Die Zellen wurden 6 (nicht gezeigt), 24, 48, 72, 96, 120, 144 und 168 Stunden 
nach der Transfektion geerntet und die Luziferaseaktivitaten luminometrisch bestimmt. 

40 Fig. 12: Selektlonlerbare HCV-Voliangengenome (Konstrukte l 389 /core-375.1 und l 389 /core-379-13F). 

(A) Schematische Darstellung des Voliangenkonstrukts. Der Bereich zwischen den beiden ange- 
deuteten Erkennungsstellen fur das Restriktionsenzym Sfi I entspricht den Sequenzen der hoch- 
adaptierten RNA-Varianten 5.1. oder 9-13F. 
45 (B) Anzahl der Kolonien die nach Transfektion von jeweils 0,1 \iq in vitro transkribierter RNA der 

unter A dargestellten Konstrukte l 389 /core-375.1 in HUH7-Zellen erhalten wurden. Angegeben ist 
das Ergebnis eines reprSsentativen Experimentes. 

(C) Nachwels autonom replizierender HCV-Vollangen-RNAs in G418-resistenten Zellklonen, die 
nach Transfektion des entsprechenden in vitro Transkripts erhalten wurden. Die Abbildung zeigt das 

so Autoradiogramm eines Northern Blots, der mit einer Sonde gegen das neo-Resistenzgen und der 

HCV 5' NTR hybridisiert wurde. Die in Spur 1 und 2 dargestellten Kontrollen entsprechen jeweils 10 8 
MolekOlen der angegebenen in vitro Transkripte, gemischt mit Gesamt-RNA aus naiven Huh-7 Zel- 
len. Die Negativkontrolle enthait ausschliefilich Gesamt RNA aus naiven Huh-7 Zellen (Spur 3). Die 
Spuren 4-9 enthalten 3-10 ug Gesamt-RNA aus G418-resistenten Zellklonen, die nach Transfektion 

55 von in vitro transkribierter l 389 /core-375.1-RNA bzw. l 389 /core-379-1 3F-RNA erhalten wurden. Die 

Kir die Selektion verwendete G418-Konzentration ist jeweils angegeben. Funf der dargestellten Zell- 
klone enthalten die hoch adaptierte RNA-Variante 5.1 (Spur 4-8), einer die adaptierte RNA-Variante 
9-1 3F (Spur 9). 



25 Fig. 11 A: 
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Fig. 13: HCV-RNA-Konstrukte mit einem Reportergen. (A) Bicistronische HCV-RNA-Konstrukte. Das Reporter- 
gen wird mit Hilfe einer separaten IRES translatiert. (B) Monocistronische HCV-RNA-Konstrukte. Das 
Reportergenprodukt wird als Fusionsprotein mit einem HCV-Protein exprimiert. Die belden Anteile sind 
uber eine Erkennungssequenz fur eine virale oder zelluiare Protease verbunden, die eine proteolytische 
Trennung der beiden fusionierten Proteinanteile erlaubt. Im gezeigten Beispiel wurden das Reportergen- 
produkt und das jeweilige HCV-Protein Ober eine Erkennungssequenz fOr Ubiquitin (Ub) fusioniert. 

Fig. 14: Tricistronisches VollSngen HCV-RNA-Konstrukt, das zusatzlich zum Resistenzgen ein Fremdgen inse- 
riert besitzt. 



Fig. 15: Monocistronische HCV-RNA-Konstrukte, bei denen das Resistenzgenprodukt als Fusionsprotein mit 
dem HCV-Anteil exprimiert wird. Das Resistenzgen (RG) ist entweder als Fusionsprotein aktiv oder es 
wird so mit einer proteolytisch spaltbaren Sequenz mit dem HCV-Anteil fusioniert, dad das Resistenz- 
genprodukt durch eine zelluiare oder virale Protease vom HCV-Anteil abgespalten wird. Im gezeigten 
is Beispiel wurde das Resistenzgen Ober die fur Ubiquitin (Ub) kodierende Sequenz mit dem jeweiligen 

HCV-Anteil fusioniert. 

Beispiel 1 : Herstellung von HCV-RNA-Konstrukten 

20 ( A) Svnthese und Klonierun o eines vollstandiaen HCV-Konsensusgenprns mittels RT- PCR 

[0053J Aus der Leber eines chronisch infizierten Patienten wurde das HCV-Genom, d.h. die HCV-RNA wie nachfol- 
gend beschrieben isoliert: 

[0054] Aus ca. 100 mg Leber wurde die komplette RNA gemafi dem Verfahren von Chomczynski und Sacci (1987, 

25 Anal. Biochem. 162, 156) Isoliert. Mit 1 \ig dieser isolierten RNA wurde eine reverse Transkription mit den Primern 
A6103 (GCTATCAGCCGGTTCATCCACTGC) oder A9413 (CAGGATGGCCTATTGG CCTGGAG) und dem 'expand 
reverse transcriptase- System (Boehringer Mannheim, Deutschland) nach den Vorschrlften des Herstellers durchge- 
fuhrt. Mit den Produkten dieser reversen Transkription (RT) wurde eine Polymerase-Kettenreaktion (PCR=polymerase 
chain reaction) durchgefOhrt, und zwar unter Verwendung des 'expand long template'-Systems (Boehringer Mannheim, 

30 Deutschland), wobei der Puffer mit 2% Dimethylsulfoxid-Gehalt eingesetzt wurde. Nach einer Stunde bei 42°C wurde 
1/8 dieses Reaktionsansatze's in einem ersten PCR-Durchgang mit den Primern A6103 und S59 (TGTCTTCACGCA- 
GAAAGCGTCTAG) Oder A9413 und S4542 (GATGAGCT CGCCGCGAAGCTGTCC) eingesetzt. Nach 40 Zyklen 
wurde 1/10 dieses Reaktionsansatzes in einem zweiten PCR-Durchgang mit den Primern S59 und A4919 (AGCACA- 
GCCCGCGTCATAGCACTCG) oder S4542 und A9386 (TTAGCTCCCCG TTCATCGGTTGG) eingesetzt. Nach 30 

35 Zyklen wurden die PCR-Produkte mittels prSparativer Agarose-Gel-Elektrophorese gereinigt und die dabei eiuierten 
Fragmente wurden in den Vektor pCR2.1 (Invltrogen) oder pBSK II (Stratagene) ligiert. Vier Klone von jedem Fragment 
wurden analysiert und sequenziert, und es wurde eine Konsensus-Sequenz ermittelt. Zu diesem Zweck wurden die 
DNA-Sequenzen miteinander verglichen. Die Positionen, an denen sich die Sequenz eines der Fragmente von den 
ubrigen unterschied, wurde als unerwQnschte Mutation betrachtet. Im Fall von Mehrdeutigkeiten der Sequenz wurden 

40 kurzere sich Qberlappende PCR-Fragmente der betreffenden Region amplifiziert und mehrere Klone sequenziert. Auf 
diese Weise konnten zahlreiche potentielle Mutationen in jedem Fragment identifiziert und somit eine isolat-spezifische 
Konsensussequenz etabliert werden. Diese etablierte Konsensussequenz bzw. dieses Genom gehflrt zum weltweit 
verbreiteten Genotyp 1b. Die nicht translatierte Region am 3'-Ende (=3* NTR) wurde mittels konventioneller PCR erhal- 
ten, wobei ein Antisense-Primer eingesetzt wurde, der die ietzten 24 Nukleotide des im Stand der Technik bekannten 

45 'X-tails' (Tanaka et al., 1995, Biochem. Biophys. Res. Commun. 215, 744; und Rice, PCT/US 96/14033) abdeckt. Die 
authentische nicht translatierte Region am S'-Ende (=5' NTR) strangabwSrts vom T7 Promotor wurde mittels PCR 
erzeugt, wobei zum einen ein Oligonukleotid verwendet wurde, das einem verkOrzten T7 Promotor (TAA TAC GAC TCA 
CTATAG) und den ersten 88 Nukleotiden von HCV entspricht, und zum anderen eines der vorgenannten Plasrnide ein- 
gesetzt wurde, das eines der 5* Fragmente des Genoms trSgt. Aus den subgenomischen Fragmenten mit der gering- 

50 sten Anzahl an Nicht-Konsensus-Austauschen wurde ein komplettes HCV-Konsensusgenom zusammengesetzt und in 
einen modifizierten pBR322-Vektor insertiert. Abweichungen von der Konsensussequenz wurden mittels ortsgerichte- 
ter Mutagenese ("site-directed mutagenesis) beseitigt. Urn "run-ofT-Transkripte mit einem authentischen 3' Ende her- 
zustellen, wurde die 3-NTR der Isolate (mit dem Ende TGT) zu AGT modifiziert (gemaii der Sequenz vom Genotyp 3 
= Klon 'WS* nach Kolykhalov et at., 1996, J. Virol. 70, 3363) und aufierdem wurde ein zusStzlicher Nukleotidaustausch 

55 an Position 9562 vorgenommen, urn die A:T Basenpaarung in der Haarnadelstruktur am 3' Ende der 3' NTR (Kolyhalov 
et al. ibid.) beizubehalten. Urn eine interne Restriktionssteile fur das Enzym Seal zu beseitigen, wurde ferner ein sog. 
stiller ("silent") Nukleotidaustausch vorgenommen. Nach dem Zusammenfugen des VollSngen-Genoms mft passenden 
5*- und 3' NTRen wurde die komplette HCV-Sequenz uberprtift. Dabei wurde kein ungewunschter Nukleotidaustausch 
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gefunden. 

[0055] Das auf diese Weise hergestellte HCV-Genom sollte per Definition hepatotrop sein. 
(B) Svnthese selektie rbarer HCV-Suboenom-KonstruKte 

5 

[0056] Unter Verwendung des unter (A) beschriebenen Konsensusgenoms wurden HCV-Subgenom-Konstrukte 
hergestellt, die das Antibiotikumresistenzgen Neomycin-Phosphotransferase (NPT) und zwei Sequenzen von internen 
Ribosomenbindungsstelten (IRES) enthalten. Die hierfur angewendeten biochemischen Verfahrenstechniken sind dem 
Fachmann bekannt und gelSufig (siehe: Sambrook, J., E.F. Fritsch, T. Maniatis, 1989, Molecularcloning: a laboratory 

w manual, 2nd ed., Cold Spring Harbour Laboratory, Cold Spring Harbor, N.Y.; Ausubel et al. (eds.), 1994, Current Proto- 
cols in Molecular Biology, Vol. 1-3. John Wiley & Sons Inc., New York). Das Antibiotikumresistenzgen wurde unmittelbar 
hinter der 5' NTR insertiert, wodurch eine bicistronische RNA erhalten wurde (siehe Fig. 1 A). Ebensogut kann das Anti- 
biotikumresistenzgen aber auch an anderer Stelle des HCV-Subgenom-Konstrukts insertiert werden, beispielsweise 
innerhalb der fur das Polyprotein kodierenden Nukleotidsequenz, wodurch eine monocistronische RNA erhalten wird 

15 (siehe Fig. 5 A) oder in die 3' NTR (siehe Fig. 5 B). Bei den IRES-Elementen handelt es sich zum einen um eine der 
beiden HCV-IRES-Varianten Nukleotide 1-377 oder Nukleotide 1-389, und zum anderen um die IRES des Enzephalo- 
myocarditis Virus, die die Translation der HCV Sequenz strangabwflrts von den Genen fur NS2 oder NS3 bis zu dem 
authentlschen 3 1 Ende des Genoms steuert. 

[0057] Die beiden genannten HCV-IRES-Varianten wurden wie folgt ermittelt: Auf der Basis von Deletionsanalysen 

20 der 3' Grenze der HCV-IRES (Reynolds et al. 1995, EMBO J. 14, 6010) wurden verschiedene Abschnitte der 5' NTR 
mit dem NPT Gen fusioniert und anhand von Kotransfektionen mit einem das T7 RNA Polymerase Gen enthaltenden 
Plasmid hinsichtlich der maximalen Anzahl geblldeter Kolonien analysiert. Die besten Ergebnisse wurden mit den HCV 
Sequenzen von 1-377 und 1-389 erhalten. Da sich das AUG-Startkodon des HCV Polyproteins an Position 342 befindet 
und somit in der IRES-Sequenz enthalten ist, kommt es zu einer Fusion von 12 bzw. 16 AminosSuren des HCV-Kap- 

25 sidproteins ("Core-Proteins") mit der Neomycin Phosphotransferase (siehe Fig. 1 A). 

[0058] Diese modifizierten HCV-Subgenom-Konstrukte erhielten dementsprechend die Bezeichnungen l 377 /NS2- 
3' (oder l 37 7/NS3-3') und l3 8 9/NS2-3* (oder l3 89 /NS3-3'). Sie sind in Fig. 1A schematisch dargestellt. 
[0059] Mit in-vitro-Transkripten dieser modifizierten parentalen HCV-Subgenom-Konstrukte l 377 /NS2-3' (oder 
l 377 /NS3-3') und I389/NS2-3* (oder I389/NS3-3') wurden verschiedene Zellinien und PrimSrzellkulturen von menschli- 

30 chen Hepatocyten transfiziert. 

[0060] Als parallele Negatlv-Kontrolle zu alien Transfektlonsexperimenten wurde zu jedem modifizierten parentalen 
HCV-Subgenom-Konstrukt ein entsprechend modifiziertes aber defektes Subgenom konstruiert, das sich von dem par- 
entalen dadurch unterscheidet, dad es innerhalb des Leserasters eine Deletion von 10 AminosSuren aufweist, die das 
aktive Zentrum der NS5B RNA Polymerase umfafit (Behrens et al., 1996, EMBO J. 15, 12; und Lohmann et al., 1997, 

35 J. Virol. 71, 8416). 

(Q Svnthese selektierbarer HCV-Genom-Konstrukte 

[0061] Ein NS2-3* Subgenomkonstrukt, das am 5' Ende mit einem Fragment des Luziferasegens und der vollstan- 
40 digen EMCV-IRES verbunden ist, wurde mitNcol und Spel restringiert und mittels prSparativer Agarosegelelektropho- 
rese gereinigt. Der so erhaltene Vektor wurde in einer 3-Faktor Ligation mit einem Ncol/Notl-HCV-Fragment, 
entsprechend den Nukleotidpositionen 342 bis 1968 des HCV-Genoms und mit einem Notl/S pel-Fragment, entspre- 
chend den Nukleotidpositionen 1968-9605 ligiert. Das entstandene Konstrukt, bei dem das vollstandige HCV-Leser- 
aster und die 3* NTR stromabwSrts dem Luziferasegenfragment und der EMCV-IRES liegen, wurde danach mit Pmel 
45 und Spel restringiert und mit dem analog restringierten l 389 /NS3-37wt-Subgenomkonstrukt-Vektor ligiert. Dieses selek- 
tionierbare HCV-Genomkonstrukt ist in Fig. 4 dargestellt. 

(V)) Herstelluna von den HCV-RNA-Konstrukt en entsprechenden in-vitro-TrnaskriDten 

so [0062] Die vorstehend beschriebenen gereinigten Plasmid DNAs wurden mit Seal linearisiert und nach Phe- 
nol/Chloroform-Extraktion und Isopropanol-Prazipitation in eine In-vitro-Trankriptionsreaktion eingesetzt unter Verwen- 
dung derfolgenden Komponenten: 80 mM HEPES, pH 7.5, 12,5 mM MgCI 2 , 2 mM Spermidin, 40 mM Dithiothreitol, 2 
mM von jedem NTP, 1 Einheit RNasin/ul, 50 ug/ml restringierte DNA und ca. 2 Einheiten/uJ T7 RNA Polymerase. Nach 
2 Std. bei 37°C wurde die Haifte der Menge an T7 Polymerase zugegeben und der Reaktionsansatz weitere 2h inku- 

55 biert. Zur Entfernung von DNA wurde die Mischung mit saurem Phenol extrahiert (U. Kedzlerski, J.C. Porte, 1991, Bio 
Techniques 10, 210), mit Isopropanol prazipitiert, das Pellet in Wasser gelost und mit DNase (2 Einheiten pro |ig DNA) 
fOr 60 Min. bei 37°C inkubiert. Nach anschlieliender Extraktlon mit saurem Phenol, saurem Phenol/Chloroform und 
Chloroform und Isopropanol- Prazipitation wurde die gelBste RNA mittel optischer Dichtemessungen quantifiziert und 
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ihre Unversehrtheit mittels Formaldehyd-Agarose-Gelelektrophorese uberpruft. 
Beispiel 2 : Transfektionsexperimente mit der Hepatomazellinie Huh-7 

5 [0063] Bei sSmtlichen Transfektionsexperimenten wurde sorgfaltig darauf geachtet, dali jegliche Matrizen-DNA 
zuvor entfernt worden war, urn zu vermeiden, dali solche DNA in transfizierte Zellen integrieren und diesen unabhangig 
von einer HCV-Replikation eine Neomycin-Resistenz vermitteln konnte. Deshalb wurde im Anschlufi an die in-vitro- 
Transkription ( Beispiel 1 D) die Reaktionsmischung mit 2 Einheiten DNase pro ug DNA fur 60 Min. bei 37°C behandelt 
und mit saurem Phenol, saurem Phenol/Chloroform und Chloroform extrahiert. Vor der Verwendung fur die Transfektion 

10 wurde die prSzipitierte RNA mittels Formaldehyd Agarose Gel Elektrophorese analysiert. 

[0064] Es wurden drei separate Transfektionsxperimente mit der hoch differenzierten humanen Hepatomazellinie 
Huh-7 (gemSft Nakabayashi et a). 1982, Cancer Res. 42, 3858) durchgefOhrt. Dabei wurde jeweils 15 ug RNA In 8 x 
10 6 Huh-7-Zellen mit Hilfe der Elektroporation eingebracht und diese Zellen anschliefiend in Kulturschalen von 10 cm 
Durchmesser ausgesat. 24 Stunden nach der Aussaat wurde Neomycin (= G418) in einer Endkonzentration von 1 

15 mg/ml zugegeben. Das Kulturmedium wurde zweimal pro Woche gewechselt. Nach 3 - 5 Wochen waren kleine Kolo- 
nien erkennbar, die isoliert und unter den gleichen Kulturbedingungen passagiert wurden. 

[0065] Die Zellklone, die im Verlauf des ersten Experiments erhalten wurden, wurden isoliert und subpassagiert 
Wahrend dieser Prozedur starben die meisten Klone und die Endausbeute betrug nur noch 9 Klone von Zellen, die mit 
den parentalen HCV-Subgenom-Konstrukten transfiziert worden waren und 1 Klon (Klone 8-1) von Zellen, die mit 
20 einem defekten HCV-Genom-Konstrukt. nSmlich einer defekten NS2-3* HCV-RNA transfiziert worden waren. Aufter 
einer verkurzten Verdopplungszeit und dem gelegentlichen Auftreten von irregular geformten Zellen wurden keine 
bestSndigen morphologischen Unterschlede zwischen diesen 9 Zellklonen und dem einen Zellklon (Klon 8-1 ) oder den 
parentalen Huh-7 Zellen gefunden. 

[0066] Die Hauptkriterien fur funktionierende HCV-Genomkonstrukte sind die Bildung von viraler RNA mit korrekter 
25 GrdfSe und die Abwesenheit von (integrierter) Plasmld DNA, die eine G418-Resistenz ubertragen bzw. vermitteln 
k6nnte. 

[0067] Um die HCV-RNA in den Huh-7-Zellen zu bestimmen, wurde die Gesamt-RNA isoliert und mittels des gan- 
gigen Northern-Blot Verfahrens unter Verwendung einer Plusstrang-spezifischen Ribosonde (= RNA-Sonde) analy- 
siert. Hierfur wurde von den jeweiligen Zellklonen Gesamt-RNA nach der Methode von Chomczynski und Sacchi 1987, 

30 Anal. Blochem. 162, 156 isoliert, und 10 ug RNA, was dem Gesamt-RNA-Gehalt von 0,5 - 1 x 10 6 Zellen entspricht, 
mittels denaturierender Formaldehyd-Agarose-Gelelektrophorese aufgetrennt (Spuren 3 bis 12 der Fig. 1 B). Als Gr6- 
ftenmarker mit authentischer Sequenz wurden gleichzeitlg 1 0 9 in-vitro-Transkripte (ivtr.), die zu den l 389 /NS2-37wt oder 
den l 389 /NS3-37wt Replikon-RNAs korrespondieren, mit aufgetrennt (Spur 1 bzw. Spur 2). Die aufgetrennte RNA wurde 
auf Nyion-Membranen transferiert und mit radioaktiv markierter Plusstrang-spezifischer RNA-Sonde, die komplemen- 

35 tar zu dem kompletten NPT-Gen und der HCV-IRES von Nukleotid 377 bis Nukleotid 1 war. hybridisiert. Die Positionen 
der HCV-spezifischen RNAs (Pfeile) und der 28S rRNA sind rechts von Spur 12 angegeben, die Gr6Ren (Anzahlen der 
Nukleotide) der RNA-Marker sind links von Spur 1 angegeben. Die RNA Marker-Fragmente enthalten HCV-Sequenzen 
und hybrtdisieren deshalb mit der Ribosonde (= RNA-Sonde). Die Ergebnisse dieser Analyse sind in Fig. 1 B darge- 
stellt. 

ao [0068] Mit Ausnahme des mit dem defekten HCV-Genom-Konstrukt transfizierten Klons 8-1, lieferten alle Zellklone 
homogene HCV-RNAs korrekter LSnge (ca. 8640 Nukleotide im Fall des NS2-3* und ca. 7970 Nukleotide im Fall des 
NS3-3' Replikons). Dieser Befund ist ein Indiz dafur, daft die funktionalen Replikons bzw. die funktionalen HCV-Genom- 
Konstrukte die G418 Resistenz ubertragen. Um auszuschlieften, daft die G418 Resistenz auf eine Plasmid-DNA 
zuruckzufuhren ist, die in das Genom der Huh-7 Wirtszelle Integriert ist und unter der Kontrolle eines zelluiaren Promo- 

45 tors transkribiert wird, wurde von jedem Klon die DNA mittels einer NPT-Gen-spezifischen PCR untersucht. Hierbei 
wurde aus den selektierten Huh-7-Zellklonen die DNA mittels Verdau mit Proteinase K (40ug/ml, 1h, 37°C) in 
10mMTris, pH7,5, 1mM EDTA, 0.5% SDS und anschlieftender Extraktion mit Phenol, Phenol/Chloroform und Isopro- 
panolprSzipitation isoliert. Das DNA-Prazipitat wurde in 10 mM Tris (pH 7,5) und 1 mM EDTA gelbst und 1 Stunde mit 
Rnase A inkubiert. Im Anschluli an eine Phenol/Chloroform Extraktion und Ethanol Prazipitation wurde 1 ug DNA, ent- 

50 sprechend 4 - 8 x 10 4 Zellen, mittels PCR unter Einsatz NPT-Gen-spezifischer Primer (5-TCAAGACCGACCTG 
TCCGGTGCCC-3' und S'-CTTGAGCCTGGCGAACAGTTCGGC-S') analysiert und ein DNA-Fragment bestehend aus 
379 Nukleotiden erzeugt. Die Spezifitat des PCR-Produkts wurde mittels Southern Blot Verfahren nachgewiesen, 
wobei ein Digoxigenin-markiertes DNA Fragment eingesetzt wurde, das zu dem NPT-Gen korrespondiert. Als Positiv- 
Kontrollen (zum Nachweis etwa vorhandener kontaminierender Nukleinsauren) wurde das PCR-Verfahren mit 10 7 

55 Plasmid MolekQIen oder 1 pg DNA aus einer BHK Zellinie, die stabil mit einem Neomycin-Resistenz-Gen transfiziert 
war, durchgefOhrt, und als Negativ-Kontroile wurde die PCR mit denselben Reagenzien aber ohne zugesetzte DNA 
durchgefuhrt. 

Die Ergebnisse dieser Untersuchung sind in Fig. 1 C dargestellt. Die Spuren 1 und 2 reprasentieren die Positiv-Kontrol- 
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len, Spur 13 reprSsentiert die Negativ-Kontrolle. Die Zahlenangaben links der Spur 1 bezeichnen die Grofte der 
Nukleotid-Marker-Molekule. Aufter in Klon 7-3 (Fig. 1C, Spur 3), der von Zellen nach Transfektion mit einem NS2-3' 
Replikon/NS2-3 , HCV-Genom-Konstrukt stammt, und in Klon 8-1 (Fig. 1C, Spur 12), der von Zellen nach Transfektion 
mit einem defekten HCV-Genom-Konstrukt stammt, war in keinem Zellklon eine NPT-DNA nachweisbar. Dieser Befund 

5 ist ein weiteres Indiz dafur, daft die G418 Resistenz der meisten Klone durch die replizierende HCV-RNA vermittelt 
wurde. Aber auch unabhangig von diesen Ergebnissen ist es unwahrscheinlich, daft HCV-RNAs mit korrekter Grdfte 
von integrierter Plasmid DNA erzeugt wird, denn die fur die in-vitro-Transkription verwendeten Plasmide enthalten 
weder einen eukaryontischen Promotor noch ein Polyadenylierungssignal. Im Fall des Klons 7-3 ist die Resistenz des- 
halb htichst wahrscheinlich sowohl durch das HCV-RNA-Konstrukt bzw. die replizierende HCV-RNA als auch durch 

10 e jne integrierte NPT DNA Sequenz vermittelt worden, wahrend die Resistenz der Zellen von Klon 8-1 ausschlieftlich 
auf die integrierte Plasmid DNA zurOckzufuhren ist. 

[0069] Urn 2u bestatigen, daft die G41 8 Resistenz von einer autonom replizierenden HCV-RNA vermittelt ist, wurde 
der Klon 9-13 (Fig. 1 B, Spur 11) weiteren Tests unterworfen. Klon 8-1, der Integrierte Kopien des NPT-Gens trSgt, 
wurde uberall als Negativkontrolle eingesetzt. Mit dem Ziel, die Anwesenheit von NPT-DNA im Klon 9-13 rigoros aus- 

15 zuschlieften, wurde eine PCR durchgefuhrt, die den Nachweis von < 1000 NPT-Gen-Kopien in - 40.000 Zellen erlaubt. 
Das Ergebnis dieser PCR ist in Fig. 2A dargestellt. Im einzelnen wurde bei dieser PCR wie folgt verfahren: 
Es wurden jeweils 10 6 - 10 2 Plasmid Molekule (l 377 /NS3-37wt) entweder direkt (Spuren 7 - 1 1) oder nach Zugabe von 
jeweils 1 pg 9-13 DNA (Spuren 2 - 6) in dem Test eingesetzt. Die Spezifitat der amplifizierten DNA Fragment wurde mit- 
tels Southern Blot unter Verwendung einer NPT-spezifischen Sonde bestimmt. Eine PCR ohne DNA-Sonde wurde als 

20 Negativ-Kontrolle durchgefuhrt (Spur 12). 

Selbst mit dieser sensitiven Methode wurde in einem u.g DNA des Zellklons 9-13 keine Plasmid DNA gefunden (Spur 
1). Urn die Menge an HCV Plus- und Mlnusstrang RNAs in diesen Zellen abzuschatzen, wurde eine Verdunnungsreihe 
von Gesamt-RNA mit dem Northern-Blot- Verfahren unter Verwendung einer Plus- oder Minusstrang-spezifischen 
radioaktiv markierten Ribosonde (= RNA-Sonde) analysiert. Hierfur wurden jeweils 8, 4 oder 2 ug Gesamt-RNA, die 

25 aus den Zellklonen 9-13 und 8-1 isoliert worden waren, parallel zu bekannten Mengen analoger in-vitro-Transkripte mit 
Plus- oder Minusstrang-Polaritat (Kontroll-RNAs) im Northern-Blot-Verfahren analysiert und anschlieftend einer Hybri- 
dlsierung unterworfen. Die Hybridisierung wurde mit einer Plusstrang-spezifischen Ribosonde, die das komplette NPT- 
Gen und die HCV-IRES abdeckte fplusstrand', obere Bildtafel), oder mit einer Minusstrang-spezifischen RNA-Sonde, 
die zu der NS3-Sequenz komplementar war ('minusstrand', untere Bildtafel) durchgefuhrt. Die Pfeile markieren die 

30 Positionen von Replikon-RNA. Die Ergebnisse dieser Analyse sind in Fig. 2 B dargestellt. 

Im Fall des Plusstrangs wurden ca. 10 8 Kopien/ug Gesamt-RNA nachgewiesen, was 1000 - 5000 HCV-RNA-Molekulen 
pro Zelle entspricht, wahrend die Menge an Minusstrang-RNA 5- bis 10-fach niedriger war. Dieses Ergebnis stimmt mit 
der Annahme uberein, daft die Minusstrang RNA die replikative Zwischenform bzw. Zwischenkopie ist, die als Vorlage 
fur die Synthase der Plusstrang MolekUle dient. 

35 Da die Reaktion im wesentlichen von der viralen RNA-abhangigen RNA Polymerase katalysiert wird, sollte die Syn- 
these der HCV-RNAs resistent gegen Dactinomycin sein, einem Antibiotikum, das selektiv die RNA-Synthese von 
DNA-Matrizen inhibiert, nicht jedoch die RNA-Synthese von RNA-Matrizen. Urn diese Vermutung zu bestatigen, wur- 
den Zellen mit [ 3 H] Urldin in Anwesenheit von Dactinomycin inkubiert, die radioaktiv markierten RNAs extrahiert, mittels 
denaturierender Agarose-Gel-Elektrophorese aufgetrennt und mit Hilfe eines handelsublichen Bio-lmagers unter Ver- 

40 wendung einer [ 3 H]-sensitiven Bildplatte analysiert. Hierfur wurden jeweils ca. 5 x 10 5 Zellen der Klone 9-13 und 8-1 
mit 100 u. Ci [ 3 H]Uridin fur 16 Std. in Abwesenheit (-) oder Gegenwart (+) von 4 u.g/ml Dactinomycin (Dact) inkubiert. 
Im Anschluft an diese Markierungsreaktion wurde die Gesamt-RNA prapariert und mittels Formaldehyd-Agarose-Gel- 
Elektrophorese analysiert. In den beiden ersten Spuren ist nur 1/10 der Gesamt-RNA dargestellt. Die radioaktiv mar- 
kierte RNA wurden mit einem BAS-2500 Bio-lmager (Firma Fuji) sichtbar gemacht. 

45 Die Ergebnisse dieser Analyse sind in Fig. 2 C dargestellt. In Obereinstimmung mit dem Inhibitor-Profil der NS5B Poly- 
merase (Behrens et al., 1996, EMBOJ. 15, 12 und Lohmann et al., 1997, J Virol. 71, 8416) war die Replikation der HCV 
RNA nicht durch Dactinomycin beeinfluftt worden, wahrend die Synthese von zelluiarer RNA gehemmt worden war. Um 
die Identitat der viralen RNA zu bestatigen, wurde eine RT-PCR zur Reklonierung der replizlerten Sequenzen durchge- 
fuhrt. Die Sequenzanalyse der reklonlerten RNA zeigte, daft die RNA in dem Klon 9-13 HCV-spezifisch ist und mit dem 

50 transfizierten Transkript des HCV-Konstrukts l 3 77/NS3-37wt Obereinstimmt. 

[0070] Zur Analyse der viralen Proteine wurden die betreffenden Zellen zunachst metabolisch mit [ 35 S] Methio- 
nin/Cystein radioaktiv markiert, anschlieftend lysiert und danach die HCV-spezifischen Proteine mittels Immunoprazi- 
pitation aus den Zell-Lysaten isoliert. Die Ergebnisse dieser Analysen sind in Fig. 3 A dargestellt. Im einzelnen wurde 
dabei wle folgt verfahren: Zellen derZellklone 9-13 (wt) und 8-1 (A) waren durch Behandlung fur 16 Stunden mit einer 

55 dem Fachmann gelSufigen und im Handel erhaitlichen Protein-Markierungs-Mischung (z.B. NEN Life Science) metabo- 
lisch radioaktiv markiert worden. Mittels Immunoprazipitation (IP) unter nicht-denaturierenden Bedingungen (z.B. nach 
Bartenschlager et al., 1995, J. Virol. 69, 7519) und unter Verwendung von drei verschiedenen Antiseren (3/4, 5A, 5B, 
gemaft Markierung am oberen Ende der Spuren 1 bis 12) waren die HCV-spezifischen Proteine vom Zell-Lysat abge- 
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trennt worden.. Die Immunokomplexe wurden mittels Tricine SDS-PAGE anatysiert und mittels Autoradiographie sicht- 
bar gemacht. Urn authentische Grdftenmarker zu erhalten, wurde das homologe Replikonkonstrukt l 37 7/NS3-3'/wt einer 
transienten Expression mit dem Vaccinia Virus T7-Hybrid System in Huh-7 Zellen unterworfen. Die dabei erhaltenen 
Produkte waren als Grtiftenmarker (Spuren 7-9) parallel zu den Zellen der Klone 9-13 und 8-1 behandelt worden. 
5 Identifizierte HCV-Proteine sind am linken Rand von Spur 1 markiert, die Molekulargewichte (in Kilodalton) sind am 
rechten Rand von Spur 9 angegeben. Es ist anzumerken, daft das verwendete NS3/4-spezifische Antiserum ('3/4') 
bevorzugt mit NS4A und NS4B reagiert, was zu einer Unterreprasentation von NS3 fuhrt. 

[0071] Alle viralen Antigene waren eindeutig nachwetsbar und ihre apparenten Molekulargewichte zeigten keine 
Abweichungen gegenOber denjenigen, die nach transienter Expression desselben bicistronischen HCV-RNA-Kon- 

10 strukts in den ursprOnglichen Huh-7 Zellen ermittelt wurden. Um die subzellulare Verteilung der viralen Antigene zu 
bestimmen, wurde eine Immunofluoreszenz-Nachweisreaktion unter Einsatz von NS3- und NS5A-spezifischen Antise- 
ren durchgefuhrt (z.B. nach Bartenschlager et al., 1995, J. Virol. 69, 7519). HierfOr wurden Zellen der Klone 9-13 (wt) 
und 8-1 (A) 24 Std. nach dem AussSen auf Deckglasern mit Methanol/Azeton fixiert und mit polyklonalen NS3- Oder 
NS5A-spezifischen Antiseren inkubiert. Die gebundenen Antikorper wurden mit einem kommerziell erhSltlichen FITC- 

15 konjugierten Anti-Kaninchen-Antiserum sichtbar gemacht. Zur Unterdruckung unspezitlscher Fluoreszenzsignale wur- 
den die Zellen mit dem Farbstoff 'Evans Blue* gegengefSrbt. 

[0072] Die Ergebnisse dieses Nachweistests sind in Fig. 3 B dargestelit. Mit beiden Antiseren war eine starke Fluo- 
reszenz im Zytoplasma nachweisbar. Die NS5A-spezifischen Antiseren fuhrten aufterdem zu einer schwachen Zell- 
kern-Fluoreszenz, was darauf hindeutet, daft zumlndest kleine Mengen dieses Antigens auch zum Zellkern gelangen. 

20 Die generell dominierende Prfisenz der viralen Antigene im Zytoplasma ist jedoch ein starkes Indlz dafOr, daft die HCV- 
RNA Replikation im Zytoplasma stattfindet — so wie das bei den meisten RNA-Viren der Fall ist. 
[0073] Diese Ergebnisse belegen klar, daft mit dem hier beschrlebenen Versuchsansatz der Aufbau eines Zellkul- 
tursystems fur das HCV gelungen ist, dessen Effizienz alles btsher bekannte um GrtJftenordnungen tibersteigt und erst- 
malig den Nachweis viraler NukleinsSuren und Proteine mit konventionellen und bewahrten biochemischen Methoden 

25 erlaubt. Erst diese Effizienz erlaubt uberhaupt detailierte Untersuchungen der HCV-Pathogenese, genetische Anatysen 
verschledener HCV-Funktionen und ein genaues Studium der Virus-/Wirtszellwechselwirkungen, wodurch sich neue 
Ansatzpunkte fur die Entwicklung einer antiviralen Therapie definieren lassen. 

Belspiel 3 : Transfektion von Huh-7 Zellen mit HCV-Genomkonstrukten 

30 

[0074] Huh-7 Zellen werden wie in Beispiel 2 beschrieben transfiziert und selektioniert, wobei hier jedoch selektio- 
nierbare Konstrukte verwendet werden, die das vollstSndige Virusgenom enthalten. Die erhaltenen Zellklone werden 
analog dem Belspiel 2 mittels PCR auf Abwesenheit von HCV-DNA untersucht und die produktive Replikation der HCV- 
RNA wird danach mittels Northern Blot, [ 3 H]Uridinmarkierung in Anwesenheit von Dactinomycin, Nachweis der viralen 

35 Proteine bzw. Antigene vorzugsweise mit Hilfe des Western Blots, der Immunoprazipltation oder der Immunfluoreszenz 
nachgewiesen. Im Gegensatz zu den im Beispiel 2 beschriebenen AnsStzen lassen sich mit dem hier beschrlebenen 
Konstrukt aufterdem vollstandige und sehr wahrscheinlich infektiose Viren erhalten, was bei den dort (in Beispiel 2) 
beschriebenen Subgenomkonstrukten nicht der Fall ist. Diese Viren, die in derZelle und dem Zellkulturuberstand vor- 
handen sind, werden beisplelsweise mittels Ultrazentrifugation, ImmunprSzipitation oder FSIIung mit Polyethylenglykol 

40 konzentriert und alle exogenen, d.h. nicht im Viruspartikel eingebauten NukleinsSuren werden mittels Inkubation mit 
Nukleasen (RNase, DNase, Mikrococusnuklease) verdaut. Auf diese Weise lassen sich alle kontaminierenden Nukle- 
insSuren, die nicht im schutzenden Viruspartikel enthalten sind, entfernen. Die geschUtzte virale RNA wird nach Inak- 
tivierung der Nukleasen, beispielsweise mittels Inkubation mit Proteinase K in einem SDS-haltigen Puffer durch 
Extraktion mit Phenol und Phenol/Chloroform isoliert und mittels Northern Blot oder RT-PCR unter Verwendung HCV- 

45 spezifischer Primer nachgewiesen. Auch in diesem Versuchsansatz ist die Kombination des beschriebenen HCV-Kon- 
sensusgenoms mit einem Selektionsmarker entscheidend fur die effizlente Produktion von viraler RNA, viralem Protein 
und damit von HCV-Partikeln. 

Beispiel 4 : Herstellung und Anwendung eines HCV-RNA Konstrukts, bei dem das Resistenzgen uber ein Ribo- 
50 zym bzw. eine Erkennungsstelle fiir ein Rlbozym mit der HCV-Subgenom-Sequenz verbunden ist. 

[0075] Es wird ein HCV-RNA-Konstrukt gemSft Beispiel 1 oder Beispiel 3 hergestellt, bei dem ein Antibiotikumresi- 
stenzgen Uber ein Ribozym bzw. eine Erkennungsstelle fur ein Ribozym mit der HCV-RNA-Sequenz verbunden ist. Sol- 
che Konstrukte sind in Fig. 7 schematisch dargestelit. Huh-7 Zellen werden wie in Beispiel 2 beschrieben mit diesem 
55 HCV-RNA-Konstrukt transfiziert. Nach der Transfektion in die Zellen erfolgt zunSchst die Selektion mit dem entspre- 
chenden Antibiotikum. In den dabei erhaltenen Zellklonen wird das einklonierte Ribozym aktiviert oder, im Fall eines 
Konstrukts, das eine Erkennungsstelle fur ein Ribozym tragt, wird das Ribozym In die Zelle eingeschleust (z.B. mittels 
Transfektion eines Ribozymkonstrukts oder Infektion mit einem viralen Expressionsvektor, in den das entsprechende 
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Ribozym eingesetzt wurde). In beiden Fallen wird durch die rlbozymvermittelte Spaltung das Resistenzgen von der 
HCV-RNA-Sequenz abgetrennt. Das Ergebnis ist im Fall des HCV-Genom-Konstrukts ein authentlsches HCV-Genom 
ohne Resistenzgen, das zur Bildung authentischer infektiOser Viruspartikel befShigt ist. Im Fall des HCV-Subgenom- 
Konstrukts entsteht ein HCV-Replikon ohne Resistenzgen. 

5 

Beispiel 5 : Kotransfektion eines HCV-RNA-Konstrukts mit einem separaten Luziferase-Transfektionskonstrukt 

[0076] Es wird ein HCV-RNA-Konstrukt gemSfi Beispiel 1 (A) oder Beispiel 3 oder Beispiel 4 hergestellt. Parallel 
dazu wird ein Transfektionskonstrukt hergestellt, welches das Luziferasegen umfaftt, wobei dieses Luziferasegen ver- 

w mittels einer ersten Nukleotidsequenz, die fur eine HCV-Protease- (z.B. NS3-Protease-) Spaltungsstelle kodiert, mit 
einer zweiten Nukleotidsequenz, die fOr ein anderes Protein oder einen Teil eines anderen Proteins kodiert, verbunden 
ist. HCV-RNA-Konstrukt und Transfektionskonstrukt werden in beliebige Wirtszellen, vorzugsweise Hepatomazellen, 
insbesondere Huh-7-Zellen, eingeschleust. Dies kann auf die in Beispiel 2 beschriebene Art und Weise geschehen. 
Das Produkt des modifizierten Luziferasegens ist ein Luziferase-Fusionsprotein, in dem die Luziferase auf Grund der 

15 Fusion mit dem Fremdanteil inaktiv ist. In transfizierten Zellen mit hoher HCV-Replikation wird das Fusionsprotein, das 
ja eine Schnittstetle fur eine HCV-Protease enthSlt, gespalten und damit die aktive Form der Luziferase freigesetzt, die 
sich durch luminometrische Messung bestimmen lafit. Wird die Replikation des HCV-RNA-Konstrukts gehemmt, wird 
das Fusionsprotein nicht gespalten und keine aktive Luziferase freigesetzt. Infoigedessen ist die quantitative Bestim- 
mung der Luziferase ein Maft fOr die Replikation des HCV-Subgenom-Konstrukts. Anstelle des Luziferasegens kann 

20 ebensogut ein anderes Reportergen verwendet werden, das in analoger Weise modifiziert ist, so daft seine Expression 
von der Virusreplikation abhSngt, obwohl dieses Reportergen nicht Bestandteil des HCV-Subgenom-Konstrukts ist. Es 
kann auch ein zellulSres Protein, welches durch die HCV-Proteine oder Nukleins^ure inaktiviert oder aktiviert wird, als 
sogenannter Surrogatmarker verwendet werden. In diesem Fall ist die Expression bzw. Aktivitdt dieses Surrogatmark- 
ers ein Mali fur die Replikation der viraten DNA. 

25 

Beispiel 6 : Herstellung von HCV-Subgenom-Konstrukten mit integrierten Fremdgenen zur Verwendung als 
leberzellspezifische GenfShren fur die Gentherapie 

[0077] Diese rekombinanten und selektionierbaren HCV-Subgenom-Konstrukte werden In trans-komplementie- 
30 rende Heiferzetlinien transfiziert, d.h. in Zeilinien, die induzierbar oder konstitutlv die fehlenden Funktionen (beispiels- 
weise die Strukturproteihe) exprimieren. Zellklone, die ein funktionelles HCV-Subgenom-Konstrukt enthalten, lassen 
sich durch entsprechende Selektion etablieren. Die von der Wirtszelle exprimierten Virus-Strukturproteine erlauben die 
Bildung von Viruspartikeln, in die die RNA der HCV-Subgenom-Konstrukte eingeschleust wird. Das Ergebnis sind also 
virus-ahnliche Partikel, die ein erfindungsgemaftes HCV-Subgenom-Konstrukt etnschlieftlich des einklonierten Fremd- 
35 gens enthalten und die dieses mittels Infektion auf andere Zellen ubertragen k6nnen. Ein Beispiel fur ein solches Kon- 
strukt ist in Fig. 8 dargestetlt. Es besteht auch die Moglichkeit, das hier beschriebene erfindungsgemafte HCV- 
Subgenom-Konstrukt mit integriertem Fremdgen direkt als Expressionsvektor einzusetzen. Dabei wird analog dem vor- 
genannten Verfahren vorgegangen, allerdings mit dem Unterschied, dafi Zeilinien transfiziert waden, die keine trans- 
komplementierenden Faktoren exprimieren. In diesem Fall dient das HCV-Konstrukt also lediglich als 
40 Expressionsvektor. 

Beispiel 7 : Herstellung zellkultur-adaptierter HCV-RNA-Konstrukte 

(A) Isolationsverfahren 

45 

[0078] Fur die Bestimmung adaptiver Mutationen und die Herstellung zellkultur-adaptierter HCV-RNA-Konstrukte 
wurde wie folgt verfahren: Zellen wurden mit einem HCV-RNA-Konstrukt wie unter den Beispielen 1 und 2 beschrieben 
transfiziert und G418-resistente Zellklone hergestellt. Zur Bestimmung der Replikationskompetenz (darunter wird in 
diesem Zusammenhang die Anzahl G418-resistenter Zellklone verstanden, die pro Mikrogramm transfizierter HCV- 

50 RNA bzw. HCV-RNA-Konstrukt erhalten wird) wurde exemplarlsch die Gesamt-RNA aus einem der Zellklone, genannt 
9-13 (Fig. 1B, Spur 11) isoliert und die Menge der darin enthaltenen HCV-RNA mittels Northern-blot wie in Fig. 2 B 
beschrieben bestlmmt. 10 Mikrogramm der Gesamt-RNA, die ca. 10 9 MolekQIe HCV-RNA enthielt, wurde anschlieftend 
per Elektroporation in naTve Huh-7 Zellen eingeschleust (Fig. 9). Parallel dazu wurden 10 9 in vitro Transkripte der ana- 
logen neo-HCV-RNA, die mit isolierter Gesamt-RNA aus naTven Huh-7 Zellen auf eine Gesamt-RNA-Menge von 10 ug 

55 aufgefullt worden war, in naive Huh-7 Zellen transfiziert. Nach Selektion mit G418 wurde die Anzahl der Zellkolonien, 
ausgedrOckt in 'colony forming units (cfu) pro Mikrogramm RNA' in den beiden AnsStzen bestimmt. Bei einer Konzen- 
tration von 500 ug/ml G418 im Selektionsmedium betrug die Zahl der Kolonien, die mit der in der isolierten Gesamt- 
RNA enthaltenen HCV-RNA erhalten wurde, ca. 100.000 cfu pro Mikrogramm HCV-RNA. Dagegen wurden mit dersel- 
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ben Menge in vitro transkribierter HCV-RNA nur 30 - 50 Kolonien erhalten. Dieses Ergebnis belegt, daft die speziflsche 
Infektiositat der HCV-RNA, die aus den Zellklonen isoliert wurde, ca. 1 .000 - 10.000-fach hOher ist als die Infektiositat 
der analogen in vitro Transkripte. Das methodische Vorgehen ist in Fig. 9 dargestellt. 

[0079] Mit Hilfe der 'long-distance RT-PCR' wurde die HCV-RNA aus der Gesamt-RNA der 9-1 3 Zellen amplifiziert 
5 die PCR-Amplifikate kloniert und zahlreiche Ktone sequenziert. Ein Vergleich der Sequenzen dieser reklonierten RNAs 
mit der Sequenz der RNA, die ursprunglich in die naiiven Huh-7 Zellen eingeschleust wurde ergab, daft die reklonierten 
RNAs zahlreiche AminosSureaustausche besaften, die Ober die gesamte HCV-Sequenz verteilt waren (Fig. 10). Sffl- 
Fragmente dieser reklonierten Mutanten wurden im Austausch gegen das analoge Sffl-Fragment des ursprOnglichen 
Replikonkonstrukts in dieses eingefuhrt und RNAs der jeweiligen Mutanten wurden in naive Huh-7 Zellen einge- 
10 schleust. Nach Selektion mit G41 8 wurde dann fOr jede HCV-RNA-Mutante die Zahl der gebildeten Kolonien bestimmt. 
Wahrend mit der Ausgangs-RNA nur 30 - 50 Kolonien pro Mikrogramm RNA erhalten wurde war die Koloniezahl bei 
zwei der reklonierten Varianten deutlich heher (Fig. 10). Im Fail der HCV-RNA-Konstrukte 9-131 und 9-1 3C betrug die 
speziflsche Infektiositat 100 - 1.000 cfu pro Mikrogramm RNA und beim 9-1 3F Replikon sogar 1.000 - 10.000 cfu pro 
Mikrogramm RNA. Diese Ergebnisse zeigen, daft die AminosSureaustausche in dem analysierten NS3-5B-Bereich der 
15 Mutanten 9-131, 9-1 3C und insbesondere 9-13F zu einer deutlichen Erhfihung der Replikationskompetenz fuhrten. 
Demgegenuber waren alle anderen HCV-RNA-Konstrukte (9-13 A, B, G, H und K) nicht mehr replikationskompetent, 
enthielten also letale Mutationen. 

[0080] Zwecks Beantwortung der Frage, welche der AminosSureaustausche im 9-13F-Konstrukt zur Steigerung 
der Replikation fOhrten, wurden die Austausche einzeln oder in Kombination in das Ausgangs-HCV-RNA-Konstrukt ein- 

20 gefiihrt und die entsprechenden RNAs in naive Huh-7 Zellen eingeschleust. Das Ergebnis der Transfektionen mit die- 
sen RNAs ist in Tabelie 1 zusammengefaftt. Daraus wird ersichtlich, daft im vorliegenden Beispiel die hohe 
Replikationskompetenz durch mehrere Mutationen bedingt ist. Den grbftten Beitrag leisten die AminosSureaustausche 
in den HCV-RNA-Abschnitten NS5A und NS4B. Auch die einzelnen Austausche in der NS3-Region leisten einen Bei- 
trag, der m6glicherwelse auf einem Synergismus dieser Einzelaustausche beruht. 

25 Diese Befunde belegen, daft es durch die G418-Selektion der Zellen, die mit den neo-HCV-RNA-Konstrukten transfi- 
ziert wurden, zur Anreicherung solcher HCV-RNAs kam, die eine deutlich hbhere Replikationskompetenz hatten. Mit 
dem hier beschriebenen Versuchsansatz lassen sich HCV-RNA-Konstrukte mit sehr unterschiedlicher Repllkationseffi- 
zienz selektionieren. Je hoher die Konzentration des Antibiotikums in dem Selektionsmedium ist, in/auf dem die HCV- 
RNA-Konstrukt-haltigen Zellen zwecks Selektion kultiviert werden, desto hbher muft der Grad an adaptiven Mutationen 

30 und damit die Replikationseffizienz in den betreffenden HCV-RNA-Konstrukten sein, damit die Zellen auswachsen kGn- 
nen. Werden die Selektionen mit niedrigeren Antibiotikum-Konzentrationen durchgefuhrt, kSnnen auch solche Zellen 
uberleben und sich vermehren, die im Vergleich geringer adaptive Mutationen und eine weniger hohe Replikationseffi- 
zienz aufweisen. 

Das bisher beschriebene HCV-RNA-Konstrukt 9-1 3F, das mehrere adaptive Mutationen enthielt, hatte eine erwiesener- 

35 maften hfihere Replikationseffizienz als die parentale HCV-RNA. Urn HCV-RNAs mit noch heherer Replikation in Zell- 
kultur zu erhalten, wurde die HCV-RNA, die in der Gesamt-RNA eines ausgewahlten Zellklons enthalten war, mehrfach 
in naTven Huh-7 Zellen passagiert. Dieser ausgewahlte Zellklon, genannt 5-15, wurde durch Transfektion mit dem HCV- 
RNA-Konstrukt l 389 /NS3-3' erhalten (Fig. 1). Er entspricht weitgehend dem Zellklon 9-13, der durch Transfektion mit 
einem HCV-RNA-Konstrukt hergestellt wurde, das eine urn 22 Nukleotide kurzere HCV-IRES besaft 0377/NS3-3'; Fig. 

40 1 ). 10 Mikrogramm Gesamt-RNA, isoliert aus dem Zellklon 5-15, wurden mittels Elektroporation in naiive Huh-7 Zellen 
eingeschleust und die Zellen einer Selektion mit 1 mg/ml G418 unterzogen. Aus einem der so erzeugten Zellklone 
wurde wiederum Gesamt-RNA isoliert, in naive Huh-7 Zellen transfiziert und analog selektion iert. Dieser Vorgang 
wurde insgesamt viermal wiederholt. Nach der vierten Passage wurde aus einem Zellklon die Gesamt-RNA isoliert und 
die neo-HCV-RNA mit Hilfe der 'long-distance RT-PCR' amplifiziert. Das ampliflzierte DNA-Fragment wurde mit dem 

45 Restriktionsenzym Sfil verdaut und in das Sfil-restringierte Ausgangskonstrukt l 389 /NS3-3' inseriert. Insgesamt wurden 
Ober 100 DNA-Klone erhalten und zunSchst mittels Restriktionsverdau analysiert. In vitro transkribierte RNA von ca. 80 
dieser Klone wurde jeweils in naive Huh-7 eingeschleust und einer Selektion mit 500mg/ml G418 unterzogen. Von den 
80 untersuchten neo-HCV-RNA-Varianten erwiesen sich die allermeisten als replikationsdefekt. Bei zwei Mutanten, 
genannt 5.1 und 19, war die speziflsche Infektiositat, ausgedrOckt als 'colony forming units' pro Mikrogramm RNA, 

so jedoch sehr deutlich erhoht (Tabelie 2). Durch mehrfache Passage der RNA in Zelikultur lassen sich offensichtlich HCV- 
RNAs herstellen, deren Replikationseffizienz aufgrund von Mutationen (sog. "adaptiven Mutationen) mehrere GrSften- 
ordnungen hoher ist als die der ursprOnglich aus dem Patienten klonierten RNA. 

(B) Modifikationsverfahren 

55 

[0081] Solche nach (A) erzeugtenn und identifizierten adaptiven Mutationen kflnnen in ein wenig replikationskom- 
petentes HCV-RNA-Konstrukt Obertragen werden und fOhren zu einer massiven Steigerung der Replikation dieses 
Konstrukts. Diese Steigerung ist so hoch, daft damit nachweislich HCV-RNAs in Zelikultur zur Replikation gebracht 
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werden ktfnnen, die kein selektierbares Markergen mehr besitzen. Fig. 12 zeigt einen Vergleich der Replikationseffizi- 
enz von HCV-RNAs, die entweder der Ausgangssequenz Oder den adaptierten Sequenzen 9-1 3F bzw. 5.1 entspra- 
chen. Zwecks einfacher Messung wurde das neo-Gen entfernt und durch das Gen fur die Luziferase ersetzt. Als 
Negativkontrolle diente wiederum ein HCV-RNA-Konstrukt, das auf Grund einer inaktivierenden Mutation der NS5B 

5 RNA-Polymerase replikationsdefekt war. Schon 24 Stunden nach der Transfektion erkennt man einen deutlichen Unter- 
schied in der Luziferaseaktivitfit zwischen der defekten RNA und den 9-1 3F bzw. 5.1-Konstrukten wShrend zwischen 
der defekten RNA (318 DN) und dem Ausgangs-RNA-Konstrukt (wt) das keine adaptiven Mutationen besaft, kaum ein 
Unterschied zu sehen war. Wdhrend des gesamten Beobachtungszeitraums wurde die htichste Luziferaseaktivitdt und 
damit die hochste Replikation mit der 5.1-RNA erhalten. Diese Befunde belegen nicht nur die hone Replikationseffizi- 

10 enz dieser RNA, sondern zeigen auch, daft es moglich ist, mit adaptierten HCV-RNA-Konstrukten ein Zellkultursystem 
aufzubauen, fur das die Anwesenheit eines selektierbaren Gens nicht mehr notwendig ist. Eine zusammenfassende 
Obersicht der Nukleotid- und AminosSureunterschiede zwischen dem Ausgangskonstrukt und den Mutanten 9-1 3F, 5.1 
und 19 ist in Tabelle 3 gegeben. 

is Beispiel 8: Herstellung zellkultur-adaptierter HCV-RNA-Vollangengenome 

[0082] In den Beisplelen 1 bis 7 wurde stets eine subgenomische HCV-RNA verwendet, der die gesamte Struktur- 
proteinregion von Core bis einschlieftlich p7 bzw. NS2 fehlte. Im vorliegenden Beispiel 8 wird gezeigt, daft es mdglich 
ist, mit Hilfe der adaptierten NS3-5B-Sequenz ein HCV-VollSngengenom in Zellkultur zur Replikation zu bringen. Zu 

20 diesem Zweck wurde zunSchst das Sfil-Fragment der gemSft Beispiel 7 hergestellten, hoch adaptierten HCV-RNA 5.1 
in ein selektionierbares HCV-VollSngengenom transferiert (Fig. 12). Dieses HCV-Genom wurde in naive Huh-7 Zellen 
transfiziert und einer Selektion mit unterschiedlichen G418-Konzentrationen unterzogen. In Abhangigkeit von der 
Selektionsstarke (der G418-Konzentration) wurde eine unterschiedlich grofte Zahl an Zellklonen erhalten (Fig. 12 B) . 
Im Vergleich dazu wurden mit dem unverSnderten HCV-VoIiangengenom, das keine-adaptiven Mutationen enthielt, 

25 keine Koionien erhalten, ebenso mit der Negativkontrolle, die auf Grund einer inaktivierenden Mutation in der NS5B 
RNA-Polymerase replikationsdefekt war. Zum Nachweis dafur, daft die so entstandenen Zellklone tatsdchlich ein auto- 
nom replizierendes HCV-Voltangenkonstrukt enthielten, wurde Gesamt-RNA aus mehreren Zellklonen isoliert und mit- 
tels Northern-Blot analysiert. In alien Zellklonen war die VollSngen HCV-RNA eindeutig nachweisbar (Fig. 12). Damit ist 
eindeutig belegt, daft es mit Hilfe der an Zellkulturen adaptierten HCV-Sequenzen mdglich ist. ein HCV-Vbllangenge- 

30 nom herzustellen, das mit hoher Effizienz und autonom in einer Zellinie repliziert, d.h. es kOnnen mit dem erfindungs- 
gemdften System auch adaptierte HCV-Voll£ngengenome hergestellt werden. Da dieser Klon darOber hinaus die 
voltstdndtge HCV-Sequenz besitzt, also auch die fur die Viruspartikelbildung notwendigen Strukturprotetne, ist es mit 
diesem System meglich, grofte Mengen Infektioser Viruspartikel in Zellkulturen herzustellen. Zum Nachweis dieser 
Viren werden zellfreie OberstSnde von Zellen, die ein replizierendes HCV-VollSngengenom tragen, auf naive Huh-7 Zel- 

35 len gegeben und die so infizierten Zellen einer Selektion mit G418 unterzogen. Jeder Zellklon, der unter diesen Bedin- 
gungen auswSchst, geht auf eine infizierte Zelle zuriick. Die Viren in den ZellkulturuberstSnden von Zellen, die ein 
replizierendes HCV-Volldngengenom besitzen, konnen aber auch mit verschiedenen im Stand der Technik bekannten 
Verfahren wie Ultrazentrifugation oder Mikrodialyse angereichert und gereinigt werden und dann zur Infektion naiver 
Zellen verwendet werden. Mit diesem Verfahren ist eindeutig gezeigt, daft mit dem erfindungsgemaften HCV-Zellkultur- 

40 system zellkultur-adaptierte HCV-Vollangengenome hergestellt werden kennen, die mit hoher Effizienz in Zellen repli- 
zieren und infektidse Viren produzieren. Diese konnen ebenfalls durch Infektion eines Versuchstiers, vorzugsweise 
dem Schimpansen, nachgewiesen werden. 

Beispiel 9: Herstellung von HCV-VollSngen-Konstrukten und HCV-Subgenom-Konstrukten mit Reportergen. 

45 

[0083] Es wird ein HCV-RNA-Konstrukt hergestellt, bei dem anstelle des Antibiotikumresistenzgens ein Reporter- 
gen eingefugt wird (Fig. 13). Dabei kann die Replikation anhand der Menge bzw. der Aktivitdt des Reportergens bzw. 
Reportergenprodukts bestimmt werden. Das Reportergen ist vorzugsweise ein Gen aus der Gruppe der Luziferase- 
gene, dem CAT-Gen (Chloramphenicol-Acetyl-Transferase-Gen), dem lacZ-Gen (beta-Galaktosidasegen), dem GFP- 

50 Gen (green fluorescence protein Gen), dem GUS-Gen (Glukuronidasegen) oder dem SEAP-Gen (sezernierte alkali- 
sche Phosphatasegen). Diese Reportergene bzw. deren Produkte, nSmlich die entsprechenden Reporterproteine, kGn- 
nen z.B. mittels Fluoreszenz. Chemilumineszenz, colorimetrisch oder mit Hilfe immunologischer Methoden (z.B. 
enzyme-linked immunosorbent assay, EL ISA) bestimmt werden. Das Reportergen kann entweder von einer eigenen 
IRES exprimiert werden oder in Form eines Fusionsproteins, das entweder als solches aktiv ist oder mittels einer pro- 

55 teolytisch spaltbaren AminosSuresequenz so mit einem HCV-Protein verbunden ist, daft es von einer zellulSren oder 
viralen (HCV-)Protease von diesem abgespalten wird. 
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Belsolel 10 : Herstellung von HCV-Vollangen-Konstrukten mit Integrlerten Fremdgenen zur Verwendung als 
leberzellspezifische Genfahre fur die Gentherapie oder als Expressionsvekto^ 

[0084] Das Konstrukt (Fig. 14) wird in Zellen eingeschleust und ftihrt dort zur Bildung von HCV-Viruspartikeln, die 
zur Infektion welterer Zellen verwendet werden konnen. Da die Viruspartikel eine RNA mit einem Fremdgen enkapsi- 
diert haben kann dieses in den so infizierten Zellen zur Produktion des von diesem Fremdgen kodlerten Proteins 
benutzt werden. Zellen, die mit dem Konstrukt transfizlert wurden, exprimieren ebenfalls das Fremdgen. 

Belspiel 11: Herstellung von monoclstronlschen HCV-RNA-Konstrukten, bei denen das Resistenzgenprodukt 
als Fusionsprotein mit dem HCV-Anteil exprimiert wird. 

[0085] Fur bestimmte Untersuchungen ist es von Vorteil, wenn das HCV-RNA-Konstrukt kein heterologes IRES- 
Element besitzt. Solche Untersuchungen sind beispielsweise die Bestimmung der Interferonresistenz. Wird eine Zelle, 
die ein HCV-RNA-Konstrukt besitzt, mit Interferon -alp ha oder -beta inkubiert, kommt es zu einer Reduktion der Repli- 
kation der HCV-RNA. Zur AufklSrung des Wirkungsmechanismus ist es notwendig, daft das HCV-RNA-Konstrukt keine 
heterologe IRES besitzt, da ansonsten nicht bestimmt werden kann, ob die Interferon-vermittelte Hemmung durch eine 
Hemmung der HCV-Replikation oder durch eine Hemmung der heterologen IRES vermittelt wird. Deshalb werden Kon- 
strukte hergestellt, bei denen das Resistenzgen mit einem HCV-Protein fusioniert wird (Fig. 15). Entweder das Fusions- 
protein ist als solches aktiv oder das Resistenzgenprodukt wird mittels einer proteolytisch spaltbaren 
Aminosauresequenz so mit einem HCV-Protein verbunden ist, dafi es von einer zellularen oder viralen (HCV-)Protease 
von diesem abgespalten wird. 



Tabelle 1 



Spezifische Infektiositaten (cfu/u.g RNA) der HCV-RNA-Konstrukte mit adaptiven Mutationen, die bei der 9-13F 
Mutante gefunden und in das parentale HCV-RNA-Konstrukt l 389 /NS3-37wt eingefOhrt wurden 


AminosSureaustausch 1 


HCV-Protein 


cfu/u.g RNA 2 


kein 




30-60 


1283arg->gly 


NS3 


200 - 250 


1383 glu -> ala 


NS3 


30-60 


1577 !ys -> arg 


NS3 


30-60 


1609 lys -> glu 


NS3 


160-300 


(1283 arg -> gly + 1383 glu -> ala + 1577 lys -> arg + 1609 lys - 
>glu) 


NS3 


360 - 420 


1936 pro ->ser 


NS4B 


500 - 1000 


2163 glu -> gly 


NS5A 


1000-5000 


2330 lys -> glu 


NS5A 


30-60 


2442 ile -> val 


NS5B 


30 - 60 


alle zusammen 




5000 



1 AminosSureaustausch im Polyprotein des HCV-lsolats Con-1 (EMBL-Genbank No. AJ238799); die AminosSuren sind Im 
Dreibuchstabenkode angegeben. 

2 Colony forming units (Anzahl der Zetlklone) bei einer Selektion von 500ng/ml G418. 
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Tabelle 2 



Spezifische InfektiosltSten (cfu/^g RNA) des parenta- 
len HCV-RNA-Konstrukts l 389 /NS3-37wt und der Vari- 
anten 9-13C, 9-131, 9-13F, 5.1 und 19. 


Transfizierte RNA-Vari- 
ante 


cfu/ug RNA 1 l 


Wildtyp 


30-50 


9-13 C 


100-1.000 1 


9-13 I 


100 - 1.000 


9-13 F 


1.000- 10.000 


5.1 


50.000-100.000 


19 


50.000-100.000 



1 Colony forming units (Anzahl der Zellklone) be! einer 
Selektfon von 500pg/ml G418. 
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Tabelle3: Nukkotid- und Aminos&ureunterschiede zwischen dem parentalen HCV- 
RNA-Konstrukt I 38 9/NS3-3Vwt und den Mutanten 9-131, 9-13F, 5.1 und 19 



HCV Mutante 


Nukleotidposition 


Nukleotidaustausch 


AminosiureausUasc 
h 


9-131 


3685 


C>T 


Pro > Leu 




4933 


C>T 


Thr>Met 




5249 


T>C 


- 




8486 


OT 


- 




8821 


G> A 


Trp > stop 




8991 


OG 


Arg > Gly 




9203 


A>G 


- 




9313 


T>C 


Phe > Scr 




9346 


T>C 


Val> Ala 


9-13 F 


3866 


OT 


- 




4188 


A>G 


Arg > Gly 




4489 


A>C 


GIu> Ala 




4562 


G> A 


- 




4983 


T>C 


- 




5071 


A> G 


Lys > Arg 




5166 


A>G 


Lys > Glu 




6147 


OT 


Pro > Ser 




6829 


A > G 


Glu > Gly 




7329 


A> G 


Lys > Glu 




7664 


A > G 


He > Val 




8486 


OT | 






8991 


OG 


Arg > Gly 


NK5.1 


4180 


OT 


Thr > He 




4679 


OT 
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4682 


T>C 


_ 




5610 


C> A 


Leu > lie 




6437 


A> G 


_ 




6666 


A> G 


Asn > Asp 




6842 


OT 


m 




6926 


C>T 


m 




6930 


T>C 


Ser > Pro 




7320 


C>T 


Pro > Ser 




7389 


A> G 


Lys > Glu 


NK19 


3946 


A> G 


Glu>Gly 




4078 


OG 


Ala > Gly 




4180 


C>T 


Thr>Ile 




4682 


T>C 






5610 


OA 


Leu > He 




5958 


A > T 


Met > Leu 




6170 


T> A 






6596 


G> A 






6598 


OG 


Ala > Gly 




6833 


OT 


- 




6842 


OT 






6930 


T>C 


Ser > Pro 




7141 


A> G 


Glu > Gly 




7320 


OT 


Pro > Ser 




7389 


A> G 


Lys > Glu 




7735 


G> A 


Ser > Asn 



[0086J Angegeben sind die Unterschiede der Nukleotid- und Aminosauresequenzen zwischen der Ausgangs-HCV- 
RNA-Sequenz Con 1 (EMBL-Genbank No. AJ238799) und denen der zellkulturadaptierten HCV-RNAs. Die Zahlen 
beziehen sich auf die Nukleotid- und Aminosfiurepositionen des HCV-lsolats Con1. 
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SEQUENCE LISTING 

<110> Bartenschlager, Ralf 

<120> Hepatitis C Virus cell culture system 

<130> ba-1 

<140> 199 15 178.4 
<141> 1999-04-03 

<160> 11 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 11076 
<212> DNA 

<213> Hepatitis C Virus 
<4 00> 1 

gccagccccc gattgggggc gacactccac catagatcac teccctgtga ggaactactg 60 
tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 
cccccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 180 
gacgaccggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgcccec 24 0 
gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 
gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 
ctcaaagaaa aaccaaacgt aacaccaacg ggcgcgccat gattgaacaa gatggattgc 420 
acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 480 
caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 540 
ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 600 
cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 660 
gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 720 
ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 780 
cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 84 0 
tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 900 
ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc 960 
atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 1020 
actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 1080 
ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 1140 
ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagtttaaa 1200 
cagaccacaa cggtttccct ctagcgggat caattccgcc cctctccctc ccecccccct 1260 
aacgttactg gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt 1320 
tccaccatat tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg 1380 
acgagcattc ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc 1440 
gtgaaggaag cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt 1500 
tgcaggcagc ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta 1560 
taagatacac ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg 1620 
gaaagagtca aatggcfcctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag 1680 
gtaccccatt gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag 1740 
tcgaggttaa aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa 1800 
cacgataata ccatgggcac gaatcctaaa cctcaaagaa aaaccaaacg taacaccaac 1860 
cgccgcccac aggacgtcaa gttcccgggc ggtggteaga tcgtcggtgg agtttacctg 1920 
ttgccgcgca ggggccccag gttgggtgtg cgcgcgacta ggaagacttc cgagcggtcg 1980 
caacctcgtg gaaggcgaca acctatcccc aaggctcgcc agcccgaggg tagggcctgg 2040 
gctcagcccg ggtacccctg gcccctctat ggcaatgagg gcttggggtg ggcaggatgg 2100 
ctcctgtcac cccgtggctc tcggcctagt tggggcccca cggacccccg gcgtaggtcg 2160 
cgcaatttgg gtaaggtcat cgataccctc acgtgcggct tcgccgatct catggggtac 2220 
attccgctcg tcggcgcccc cctagggggc gctgccaggg ccctggcgca tggcgtccgg 2280 
gttctggagg acggcgtgaa etatgcaaca gggaatctgc ccggttgctc cttttctatc 2340 
ttccttttgg ctttgctgtc ctgtttgacc atcccagctt ccgcttatga agtgcgcaac 2400 
gtatccggag tgtaccatgt cacgaacgac tgctccaacg caagcattgt gtatgaggca 2460 
gcggacatga tcatgcatac ccccgggtgc gtgccctgcg ttcgggagaa caactcctcc 2520 
cgctgctggg tagcgctcac tcccacgctc gcggccagga acgctagcgt ccccactacg 2580 
acgatacgac gccatgtcga tttgctcgtt ggggcggctg ctctctgctc cgctatgtac 2640 
gtgggagatc tctgcggatc tgttttcctc gtcgcccagc tgttcacett etcgcctcgc 2700 
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cggcacgaga cagtacagga ctgcaattgc 
cgtatggctt gggatatgat gatgaactgg 
ttactccgga tcccacaagc tgtcgtggat 
gcgggccttg cctactattc catggtgggg 
ctctttgccg gcgttgacgg gggaacctat 
ctcgggatta cgtccctctt ttcacccggg 
aacggcagct ggcacatcaa caggactgcc 
ttccttgctg cgctgttcta cgtgcacaag 
gccagctgca gccccatcga cgcgttcgct 
tcacacagct cggaccagag gccttattgt 
gtacccgcgg cgcaggtgtg tggtccagtg 
gggacgaccg accggttcgg cgtccctacg 
ctgcttctta acaacacgcg gccgccgcaa 
agcactgggt tcaccaagac gtgcgggggc 
aaaaccttga cctgccccac ggactgcttc 
tgtggttcgg ggccttggtt gacacccaga 
cactacccct gcactgtcaa ctttaccatc 
gagcacaggc tcgaagccgc atgcaattgg 
agggacagat cagagcttag ccegctgctg 
tgttccttca ccaccctacc ggctctgtcc 
gtggacgtac aatacctgta cggtataggg 
gagtatgtcc tgttgctctt ccttcttctg 
atgatgctgc tgatagctca agctgaggcc 
gcatccgtgg ccggggcgca tggcattctc 
tacatcaagg gcaggctggt ccetggggcg 
ctcctgetcc tgctggcgtt accaccacga 
tcgtgcggag gcgcggtttt cgtaggtctg 
ctgttcctcg ctaggctcat atggtggtta 
ttgcaagtgt ggatcccccc cctcaacgtt 
acgtgcgcga tccacccaga gctaatcttt 
ggtccactca tggtgctcca ggctggtata 
gggctcattc gtgcatgcat gctggtgcgg 
gctctcatga agttggccgc actgacaggt 
cgggactggg cccacgcggg cctacgagac 
tctgatatgg agaccaaggt tatcacctgg 
atcttgggcc tgcccgtctc cgcccgcagg 
agccttgaag ggcaggggtg gcgactcctc 
cgaggccte/c ttggctgcat catcactagc 
ggggaggtcc aagtggtctc caccgcaaca 
gtgtgttgga ctgtctatca tggtgccggc 
atcacccaaa tgtacaccaa tgtggaccag 
gcgcgttcct tgacaccatg cacctgcgge 
gccgatgtca ttccggtgcg ccggcggggc 
cccgtctcct acttgaaggg ctcttcgggc 
gtgggcatct ttcgggctgc cgtgtgcaec 
cccgtcgagt ctatggaaac cactatgcgg 
ccggccgtac cgcagacatt ccaggtggcc 
agcactaagg tgccggctgc gtatgcagcc 
tccgtcgccg ccaccctagg tttcggggcg 
aacatcagaa ccggggtaag gaccateacc 
ggcaagtttc ttgccgacgg tggttgctct 
gagtgccact caactgactc gaccactatc 
gagacggctg gagcgcgact cgtcgtgctc 
gtgccacatc caaacatcga ggaggtggct 
ggcaaagcca tccccatcga gaccatcaag 
aagaagaaat gtgatgagct cgccgcgaag 
tattaccggg gccttgatgt atccgtcata 
acggacgctc taa£gacggg ctttaccggc 
tgtgtcaccc agacagtcga cttcagcctg 
gtgccacaag acgcggtgtc acgctcgcag 
ggcatttaca ggtttgtgac tccaggagaa 
ctgtgcgagt gctatgacgc gggctgtgct 
gttaggttgc gggcttacct aaacacacca 
ttctgggaga gcgtctttac aggcctcacc 
aagcaggcag gagacaactt cccctacctg 
gctcaggctc cacctccatc gtgggaccaa 



tcaatatatc ccggccacgt gacaggtcac 2760 
tcacctacag cagccctagt ggtatcgcag 2820 
atggtggcgg gggcccattg gggagtccta 2880 
aactgggcta aggttetgat tgtgatgcta 294 0 
gtgacagggg ggacgatggc caaaaacacc 3000 
tcatcccaga aaatccagct tgtaaacacc 3060 
ctgaactgca atgactccct caacactggg 3120 
ttcaactcat ctggatgccc agagcgcatg 3180 
caggggtggg ggcccatcac ttacaatgag 324 0 
tggcactacg caccccggcc gtgcggtatc 3300 
tactgcttca ccccaagccc tgtcgtggtg 3360 
tacagttggg gggagaatga gacggacgtg 3420 
ggcaactggt ttggctgtac atggatgaat 3480 
cccccgtgta acatcggggg gatcggcaat 3540 
cggaagcacc ccgaggccac ttacaccaag 3600 
tgcttggtcc actacccata caggctttgg 3660 
ttcaaggtta ggatgtacgt ggggggagtg 3720 
actcgaggag agcgttgtaa cctggaggac 3780 
ctgtctacaa cggagtggca ggtatfcgccc 3840 
actggtttga tccatctcca tcagaacgtc 3900 
tcggcggttg tctcctttgc aatcaaatgg 3960 
gcggacgcgc gcgtctgtgc ctgcttgtgg 4020 
gccctagaga acctggtggt cctcaacgcg 4080 
tccttcctcg tgttcttctg tgctgcctgg 414 0 
gcatatgccc tctacggcgt atggccgcta 4200 
gcatacgcca tggaccggga gatggcagea 4260 
atactcttga ccttgtcacc gcactataag 4 320 
caatatttta tcaccagggc cgaggcacac 4380 
cgggggggcc gcgatgccgt catcctcctc 4 440 
accatcacca aaatcttgct cgccatactc 4500 
accaaagtgc cgtacttcgt gcgcgcacac 4560 
aaggttgctg ggggtcatta tgtccaaatg 4620 
acgtacgttt atgaccatct caccccactg 4 680 
cttgcggtgg cagttgagcc cgtcgtcttc 4740 
ggggcagaca ccgcggcgtg tggggacatc 4800 
gggagggaga tacatctggg accggcagac 4860 
gcgcctatta cggcctactc ccaacagacg 4920 
ctcacaggcc gggacaggaa ccaggtcgag 4980 
caatctttcc tggcgacctg cgtcaatggc 5040 
tcaaagaccc ttgccggccc aaagggccca 5100 
gacctcgtcg gctggcaage gccccecggg 5160 
agctcggacc tttacttggt cacgaggcat 5220 
gacagcaggg ggagcctact ctcceceagg 5280 
ggtccactgc tctgcccctc ggggcacgct 534 0 
cgaggggttg cgaaggcggt ggactttgta 5400 
tccccggtct tcacggacaa ctcgtcccet 54 60 
catctacacg cccctactgg tagcggcaag 5520 
caagggtata aggtgcttgt cctgaacccg 5580 
tatatgtcta aggcacatgg tatcgaccct 564 0 
acgggtgccc ccatcacgta ctccacctat 5700 
gggggcgcct atgacatcat aatatgtgat 5760 
ctgggcatcg gcacagtcct ggaccaagcg 5820 
gccaccgcta cgcctccggg atcggtcacc 5880 
ctgtccagca ctggagaaat ccccttttat 5940 
acctcatttt ctgccattcc 6000 
ctgtccggcc tcggactcaa tgctgtagca 6060 
ccaactagcg gagacgtcat tgtcgtagca 6120 
gatttcgact cagtgatcga ctgcaataca 6180 
gacccgacct tcaccattga gacgacgacc 624 0 
cggcgaggca ggactggtag gggcaggatg 6300 
cggccctcgg gcatgttcga ttcctcggtt 6360 
tggtacgagc tcacgcccgc cgagacctca 6420 
gggttgcccg tctgccagga ccatctggag 64 80 
cacatagacg cccatttctt gtcccagact 6540 
gtagcatacc aggctacggt gtgcgccagg 6600 
atgtggaagt gtctcatacg gctaaagcct 6660 
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acgctgcacg ggccaacgcc cctgctgtat aggctgggag ccgttcaaaa cgaggttact 6720 
accacacacc ccataaccaa atacatcatg gcatgcatgt cggctgacct ggaggtcgtc 6780 
acgagcaect gggtgctggt aggcggagtc ctagcagctc tggccgcgta ttgCctgaca 6840 
acaggcagcg tggtcattgt gggcaggatc atcttgtccg gaaagccggc catcattccc 6900 
gacagggaag tcctttaccg ggagttcgat gagatggaag agtgcgcctc acacctccct 6960 
tacatcgaac agggaatgca gctcgccgaa caattcaaac agaaggcaat cgggttgctg 7020 
caaacagcca ccaagcaagc ggaggctgct gctcccgtgg tggaatccaa gtggcggacc 7080 
ctcgaagcct tctgggcgaa gcatatgtgg aatttcatca gcgggacaca atatttagca 7140 
ggcttgtcca ctctgcctgg caaccccgcg atagcatcac tgatggcatt cacagcctct 7200 
atcaccagcc cgctcaccac ccaacatacc ctcctgttta acatcctggg gggatgggtg 7260 
gccgeecaac ttgctcctcc cagcgctgct tctgctttcg taggcgccgg catcgctgga 7320 
gcggctgttg gcagcatagg ccttgggaag gtgcttgtgg atattttggc aggttatgga 7380 
gcaggggtgg caggcgcgct cgtggccttt aaggtcatga gcggcgagat gccctccacc 7440 
gaggacctgg ttaacctact ccctgctatc ctctcccctg gcgccctagt cgtcggggtc 7500 
gtgtgcgcag cgatactgcg tcggcacgtg ggcccagggg agggggctgt geagtggatg 7560 
aaecggetga tagcgttcgc ttcgcggggt aaccacgtct cccccacgca ctatgtgcct 7620 
gagagcgacg ctgcagcacg tgtcactcag atcctctcta gtcttaccat cactcagctg 7680 
ctgaagaggc ttcaccagtg gatcaacgag gactgctcca cgccatgctc cggctcgtgg 7740 
ctaagagatg tttgggattg gatatgcacg gtgttgactg atttcaagac ctggctccag 7800 
tccaagctcc tgccgcgatt gccgggagtc eccttcttct catgtcaacg tgggtacaag 7860 
ggagtctggc ggggcgacgg catcatgcaa accacctgcc catgtggagc acagatcacc 7920 
ggacatgtga aaaacggttc catgaggatc gtggggccta ggacctgtag taacacgtgg 7980 
catggaacat tccccattaa cgcgtacacc acgggcccct gcacgccctc cccggcgcca 804 0 
aattattcta gggcgctgtg gcgggtggct gctgaggagt acgtggaggt tacgcgggtg 8100 
ggggatttcc actacgtgac gggcatgacc actgacaacg taaagtgccc gtgtcaggtt 8160 
ccggcccccg aattcttcac agaagtggat ggggtgcggt tgcacaggta cgctccagcg 8220 
tgcaaacccc tcctacggga ggaggteaca ttcctggtcg ggctcaatca atacctggtt 8280 
gggtcacagc tcccatgcga gcccgaaccg gacgtagcag tgctcacttc catgctcacc 8340 
gacccctccc acattacggc ggagacggct aagcgtaggc tggceagggg atctcccccc 6400 
tccttggcca gctcatcagc tagccagctg tctgcgcctt ccttgaaggc aacatgcact 8460 
acccgtcatg actccccgga cgctgacctc atcgaggcca acctcctgtg gcggcaggag B520 
atgggcggga acatcacccg cgtggagtca gaaaataagg tagtaatttt ggactctttc 8580 
gagccgctcc aagcggagga ggatgagagg gaagtatccg ttccggcgga gatcctgcgg 8640 
aggtccagga aattccctcg agcgatgccc atatgggcac gcccggatta caaccctcca 8700 
ctgttagagt cctggaagga cccggactac gtccctccag tggtacacgg gtgtccattg 8760 
ccgcctgcca aggcccctcc gataccacct ccacggagga agaggacggt tgtcctgtca 882 0 
gaatctaccg tgtcttctgc cttggcggag ctcgccacaa agaccttcgg cagctccgaa 8880 
tcgtcggccg tcgacagcgg cacggcaacg gcctctcctg accagccctc cgacgacggc 8940 
gacgcgggat ccgacgttga gtcgtactcc tccatgcccc cccttgaggg ggagccgggg 9000 
gatcccgatc tcagcgacgg gtcttggtct accgtaagcg aggaggctag tgaggacgtc 9060 
gtctgctgct cgatgtccta cacatggaca ggcgccctga tcacgccatg cgctgcggag 9120 
gaaaccaage tgcccatcaa tgcactgagc aaetetttgc tccgtcacca coacttggtc 9180 
tatgctacaa catctcgcag cgcaagcctg cggcagaaga aggtcacctt tgacagactg 9240 
caggtcctgg acgaccacta ccgggacgtg ctcaaggaga tgaaggcgaa ggcgtccaca 9300 
gttaaggcta aacttctatc cgtggaggaa gcctgtaagc tgacgccccc acattcggcc 9360 
agatctaaat ttggctatgg ggcaaaggac gtccggaacc tatccagcaa ggccgttaac 9420 
cacatccgct ccgtgtggaa ggacttgctg gaagacactg agacaccaat tgacaccacc 946 0 
atcatggcaa aaaatgaggt tttctgcgtc caaccagaga aggggggccg caagccagct 9540 
cgccttatcg tattcccaga tttgggggtt cgtgtgtgcg agaaaatggc cctttacgat 9600 
gtggtctcca ccctccctca ggccgtgatg ggctcttcat acggattcca atactctcct 9660 
ggacagcggg tcgagttcct ggtgaatgcc tggaaagcga agaaatgccc tatgggcttc 9720 
gcatatgaca cccgctgttt tgactcaacg gtcactgaga atgacatccg tgttgaggag 9780 
tcaatctacc aatgttgtga cttggccccc gaagccagac aggccataag gtcgctcaca 9840 
gagcggcttt acatcggggg ccccctgact aattctaaag ggcagaactg cggctatcgc 9900 
cggtgccgcg cgagcggtgt actgacgacc agctgcggta ataccctcac atgttacttg 9960 
aaggccgctg cggcctgtcg agctgcgaag ctccaggact gcacgatgct cgtatgcgga 10020 
gacgaccttg tcgttatctg tgaaagcgcg gggacccaag aggacgaggc gagcctacgg 10080 
gccttcacgg aggctatgac tagatactct gccccccctg gggacccgcc caaaccagaa 10140 
tacgacttgg agttgataac atcatgctcc tccaatgtgt cagtcgcgca cgatgcatct 10200 
ggcaaaaggg tgtactatct cacccgtgac cccaccaccc cccttgcgcg qgctgcgtgg 10260 
gagacagcta gacacactcc agtcaattcc tggctaggca acatcatcat gtatgcgccc 10320 
accttgtggg caaggatgat cctgatgact catttcttct ccatccttct agctcaggaa 10380 
caacttgaaa aagccctaga ttgtcagatc tacggggcct gttactccat tgagccactt 104 40 
gacctacctc agatcattca acgactccat ggccttagcg cattttcact ccatagttac 10500 
tctccaggtg agatcaatag ggtggcttca tgcctcagga aacttggggt accgcccttg 10560 
cgagtctgga gacatcgggc cagaagtgtc cgcgctaggc tactgtccca gggggggagg 10620 
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gctgccactt gtggcaagta cctcttcaac tgggcagtaa ggaccaagct caaactcact 10680 

ccaatcccgg ctgcgtccca gttggattta tccagctggt tcgttgctgg ttacagcggg 107 40 

ggagacatat atcacagcct gtctcgtgcc cgaccccgct ggttcatgtg gtgcctactc 10800 

ctactttctg taggggtagg catctatcta ctccccaacc gatgaacggg gagctaaaca 10860 

ctccaggcca ataggccatc ctgttttttt cccttttttt ttttcttttt tttttttttt 1092O 

tttttttttt ttttttttte tccttttttt ttcctctttt tctccttttc tttcctttgg 10980 

tggctccatc ttagccctag tcacggctag ctgtgaaagg tccgtgagcc gcttgactgc 11040 

agagagtgct gatactggcc tctctgcaga tcaagt 11076 
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<210> 2 
<211> 8637 
<212> DNA 

<2X3> Hepatitis C Virus 



<400> 2 

gccagccccc 

tcttcacgca 

cccccctccc 

gacgaccggg 

gcgagactgc 

gtgcttgcga 

ctcaaagaaa 

cggccgcttg 

ctgatgccgc 

acctgtccgg 

cgacgggcgt 

tgctattggg 

aagtatccat 

cattcgacca 

ttgtcgatca 

ccaggctcaa 

gcttgccgaa 

tgggtgtggc 

ttggcggcga 

agcgcatcgc 

gtttccctct 

cgaagccgct 

ccgtcttttg 

aggggtcttt 

gttcctctgg 

aaccccccac 

gcaaaggcgg 

tggctctcct 

atgggatctg 

aacgtctagg 

atggaccggg 

accttgtcac 

atcaccaggg 

cgcgatgccg 

aaaatcttgc 

ccgtacttcg 

gggggtcatt 

tatgaccatc 

gcagttgagc 

accgcggcgt 

ataeatctgg 

acggcctact 

cgggacagga 

ctggcgacct 

cttgccggcc 

ggctggcaag 

ctttacttgg 

gggagcctac 

ctctgcccct 

gcgaaggcgg 

ttcacggaca 

gcccctactg 

aaggtgcttg 

aaggcacatg 

cccatcacgt 

tatgacatca 

ggcacagtcc 

acgcctccgg 

actggagaaa 



gattgggggc 
gaaagcgtct 
gggagagcca 
tcctttcttg 
tagccgagta 
gtgccccggg 
aaccaaaggg 
ggtggagagg 
cgtgttccgg 
tgccctgaat 
tccttgcgca 
cgaagtgccg 
catggctgat 
ccaagcgaaa 
ggatgatctg 
ggcgcgcatg 
tatcatggtg 
ggaccgctat 
atgggctgac 
cttctatcgc 
agcgggatca 
tggaataagg 
gcaatgtgag 
cccctctcgc 
aagcttcttg 
ctggcgacag 
cacaacccca 
caagcgtatt 
atctggggcc 
ccccccgaac 
agatggcagc 
cgcactataa 
ccgaggcaca 
tcatcctcct 
tcgccatact 
tgcgcgcaca 
atgtccaaat 
tcaccccact 
ccgtcgtctt 
gtggggacat 
gaccggcaga 
cccaacagac 
accaggtcga 
gcgtcaatgg 
caaagggccc 
cgccccccgg 
tcacgaggca 
tctcecccag 
cggggcacgc 
tggactttgt 
actcgtcccc 
gtagcggcaa 
tcctgaaccc 
gtatcgaccc 
actccaccta 
taatatgtga 
tggaccaagc 
gatcggtcac 
tcccctttta 



gacactccac 
agccatggcg 
tagtggtctg 
gatcaacccg 
gtgttgggtc 
aggtctcgta 
cgcgccatga 
ctattcggct 
ctgtcagcgc 
gaactgcagg 
gctgtgctcg 
gggcaggatc 
gcaatgcggc 
catcgcatcg 
gacgaagagc 
cccgacggcg 
gaaaatggcc 
caggacatag 
cgcttcctcg 
cttcttgacg 
attccgcccc 
ccggtgtgcg 
ggcccggaaa 
caaaggaatg 
aagacaaaca 
gtgcctctgc 
gtgccacgtt 
caacaagggg 
tcggtgcaca 
cacggggacg 
atcgtgcgga 
gctgttcctc 
cttgcaagtg 
cacgtgcgcg 
cggtccactc 
cgggctcatt 
ggctctcatg 
gcgggactgg 
ctctgatatg 
catcttgggc 

cagccttgaa 
gcgaggccta 

gggggaggtc 

cgtgtgttgg 
aatcacccaa 
ggcgcgttcc 
tgccgatgtc 
gcccgtctcc 
tgtgggcatc 
acccgtcgag 
tccggccgta 
gagcactaag 
gtccgtcgcc 
taacatcaga 
tggcaagttt 
tgagtgccac 
ggagacggct 
cgtgccacat 
tggcaaagcc 



catagatcac 
ttagtatgag 
cggaaccggt 
ctcaatgcct 
gcgaaaggcc 
gaccgtgcac 
ttgaacaaga 
atgactgggc 
aggggcgccc 
acgaggcagc 
aegttgtcac 
tcctgtcatc 
ggctgcatac 
agcgagcacg 
atcaggggct 
aggatctcgt 
gcttttctgg 
cgttggctac 
tgctttacgg 
agttcttctg 
tctccctccc 
tttgtctata 
cctggccctg 
caaggtctgt 
acgtctgtag 
ggccaaaagc 
gtgagttgga 
ctgaaggatg 
tgctttacat 
tggttttcct 
ggcgcggttt 
gctaggctca 
tggatccccc 
atccacccag 
atggtgctcc 
cgtgcatgca 
aagttggccg 
gcccacgcgg 
gagaccaagg 
ctgcccgtct 
gggcaggggt 
cttggctgca 
caagtggtct 
actgtctatc 
atgtacacca 
ttgacaccat 
attccggtgc 
tacttgaagg 
tttcgggctg 
tctatggaaa 
ccgcagacat 
gtgccggctg 
gccaccctag 
accggggtaa 
cttgccgacg 
tcaactgact 
ggagcgcgac 
ccaaacatcg 
atccccatcg 



tcccctgtga 
tgtcgtgcag 
gagtacaccg 
ggagatttgg 
ttgtggtact 
catgagcacg 
tggattgcac 
acaacagaca 
ggttcttttt 
gcggctatcg 
tgaagcggga 
tcaccttgct 
gcttgatccg 
tactcggatg 
cgcgccagcc 
cgtgacccat 
attcatcgac 
ccgtgatatt 
tatcgccgct 
agtttaaaca 
ccccccctaa 
tgttattttc 
tcttcttgac 
tgaatgtcgt 
cgaccctttg 
cacgtgtata 
tagttgtgga 
cccagaaggt 
gtgtttagtc 
ttgaaaaaca 
tcgtaggtct 
tatggtggtt 
ccctcaacgt 
agctaatctt 
aggctggtat 
tgctggtgcg 
cactgacagg 
gcctacgaga 
ttatcacctg 
ccgcccgcag 
ggcgactcct 
tcatcactag 
ccaccgcaac 
atggtgccgg 
atgtggacca 
gcacctgcgg 
gccggcgggg 
gctcttcggg 
ccgtgtgcac 
ccactatgcg 
tccaggtggc 
cgtatgcagc 
gtttcggggc 
ggaccatcac 
gtggttgctc 
cgaccactat 
tcgtcgtgct 
aggaggtggc 
agaccatcaa 



ggaactactg 
cctccaggac 
gaattgccag 
gcgtgccccc 
gcctgatagg 
aatcctaaac 
gcaggttctc 
atcggctgct 
gtcaagaccg 
tggctggcca 
agggactggc 
cctgccgaga 
gctacctgcc 
gaagccggtc 
gaactgttcg 
ggcgatgcct 
tgtggccggc 
gctgaagagc 
cccgattcgc 
gaccacaacg 
cgttactggc 
caeca tattg 
gagcattcct 
gaaggaagca 
caggcagegg 
agatacacct 
aagagtcaaa 
accccattgt 
gaggttaaaa 
cgataatacc 
gatactcttg 
acaatatttt 
teggggggge 
taccatcacc 
aaccaaagtg 
gaaggttgct 
tacgtacgtt 
ecttgeggtg 
gggggcagac 
ggggagggag 
cgcgcctatt 
cctcacaggc 
acaatctttc 
ctcaaagacc 
ggacctcgtc 
cagctcggac 
cgacagcagg 
cggtccactg 
ccgaggggtt 
gtccccggtc 
ccatctacac 
ccaagggtat 
gtatatgtct 
cacgggtgcc 
tgggggegee 
cctgggcatc 
cgccaccgct 
tctgtccagc 

gggggggagg 



60 

120 

180 

240 

300 

360 

420 

400 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

168 0 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 



32 



EP 1 043 399 A2 



w 



15 



20 



25 



30 



35 



40 



45 



SO 



cacctcattt 
ctcggactca 
ggagacgtca 
tcagtgatcg 
ttcaccattg 
aggactggta 
ggcatgttcg 
ctcacgcccg 
gtctgccagg 
gcccatttct 
caggctacgg 
tgtctcatac 
gccgttcaaa 
tcggctgacc 
ctggccgcgt 
ggaaagccgg 
gagtgcgcct 
cagaaggcaa 
gtggaatcca 
agcgggatac 
ctgatggcat 
aacatcctgg 
gtaggcgccg 
gatattttgg 
agcggcgaga 
ggcgccctag 
gagggggctg 
tcccccacgc 
agtcttacca 
acgccatgct 
gatttcaaga 
tcatgtcaac 
ccatgtggag 
aggacctgta 
tgcaogocct 
tacgtggagg 
gtaaagtgcc 
ttgcacaggt 
gggctcaatc 
gtgctcactt 
ctggccaggg 
tccttgaagg 
aacctcctgt 
gtagtaattt 
gttccggcgg 
cgcccggatt 
gtggtacacg 
aagaggacgg 
aagaccttcg 
gaccagccct 
ccccttgagg 
gaggaggcta 
atcacgccat 
ctccgtcacc 
aaggtcacct 
atgaaggcga 
ctgacgcccc 
otatccagca 
gagacaccaa 
aaggggggcc 

gagaaaatgg 

tacggattcc 
aagaaatgcc 
aatgacatcc 
caggccataa 
gggcagaact 



tctgccattc 
atgctgtagc 
ttgtcgtagc 
actgcaatac 
agacgacgac 
ggggcaggat 
attcctcggt 
ccgagacctc 
accatctgga 
tgtcccagac 
tgtgcgccag 
ggctaaagcc 
acgaggttac 
tggaggtcgt 
attgcctgac 
ccatcattcc 
cacacctccc 
tcgggttgct 
agtggcggac 
aatatttagc 
tcacagcctc 
ggggatgggt 
gcatcgctgg 
caggttatgg 
tgccctccac 
tcgtcggggt 
tgcagtggat 
actatgtgcc 
tcactcagct 
ccggctcgtg 
cctggctcca 
gtgggtacaa 
cacagatcac 
gtaacacgtg 
ccccggcgcc 
ttacgcgggt 
cgtgtcaggt 
acgctccagc 
aatacctggt 
ccatgctcac 
gatctccccc 
caacatgcac 
ggcggcagga 
tggactcttt 
agatcctgcg 
acaaccctcc 
ggtgtccatt 
ttgtcetgtc 
gcagctccga 
ccgacgacgg 
gggagccggg 
gtgaggacgt 
gcgctgcgga 
acaaettggt 
ttgacagact 
aggcgtccac 
cacattcggc 
aggccgttaa 
ttgacaccac 
gcaagccagc 
ccctttacga 
aatactctcc 
ctatgggctt 
gtgttgagga 
ggtcgctcac 
gcggctatcg 



caagaagaaa 
atattaccgg 
aacggacgct 
atgtgtcacc 
cgtgccacaa 
gggcatttac 
tctgtgcgag 
agttaggttg 
gttctgggag 
taagcaggca 
ggctcaggct 
tacgctgcac 
taccacacac 
cacgagcacc 
aacaggcagc 
cgacagggaa 
ttacatcgaa 
gcaaacagcc 
cctcgaagcc 
aggcttgtcc 
tatcaccagc 
ggccgcccaa 
agcggctgtt 
agcaggggtg 
cgaggacctg 
cgtgtgcgca 
gaaccggctg 
tgagagcgac 
gctgaogagg 
gctaagagat 
gtccaagctc 
gggagtctgg 
cggacatgtg 
gcatggaaca 
aaattattct 
gggggacttc 
tccggccccc 
gtgcaaaccc 
tgggtcaeag 
cgacccctcc 
ctccttggcc 
tacccgtcat 
gatgggcggg 
cgagccgctc 
gaggtccagg 
actgttagag 
gccgcctgcc 
agaatctacc 
atcgtcggcc 
cgacgcggga 
ggatcccgat 
cgtctgctgc 
ggaaaccaag 
ctatgctaca 
gcaggtcctg 
agttaaggct 
cagatctaaa 
ccacatccgc 
catcatggca 
tcgccttatc 
tgtggtctcc 
tggacagcgg 
cgcatatgac 
gtcaatctac 
agagcggct t 
ccggtgccgc 



tgtgatgagc 
ggccttgatg 
ctaatgacgg 
cagacagtcg 
gacgcggtgt 
aggtttgtga 
tgctatgacg 
cgggcttacc 
agcgtcttta 
ggagacaact 
ccacctccat 
gggccaacgc 
cccataacca 
tgggtgctgg 
gtggtcattg 
gtcctttacc 
cagggaatgc 
accaagcaag 
ttctgggcga 
actctgcctg 
ccgctcacca 
cttgctcctc 
ggcagcatag 
gcaggcgcgc 
gttaacctac 
gcgatactgc 
atagcgttcg 
gctgcagcac 
cttcaccagt 
gtttgggatt 
ctgccgcgat 
cggggcgacg 
aaaaacggtt 
ttccccatta 
agggcgctgt 
cactacgtga 
gaattcttca 
ctcctacggg 
eteeeatgcg 
cacattacgg 
agctcatcag 
gactccccgg 
aacatcaccc 
caagcggagg 
aaattccctc 
tcctggaagg 
aaggcccctc 
gtgtcttctg 
gtcgacagcg 
tccgacgttg 
ctcagcgacg 
tcgatgtcct 
ctgcccatca 
acatctcgca 
gacgaccact 
aaacttctat 
tttggctatg 
tccgtgtgga 
aaaaatgagg 
gtattcccag 
accctccctc 
gtcgagttcc 
acccgctgtt 
caaCgttgtq 
tacatcgggg 
gcgagcggtg 



tcgccgcgaa 
tatccgtcat 
gctttaccgg 
acttcagcct 
cacgctcgca 
ctccaggaga 
cgggctgtgc 
taaacacacc 
caggcctcac 
tcccctacct 
cgtgggacca 
ccctgctgta 
aatacatcat 
taggcggagt 
tgggcaggat 
gggagttcga 
agctcgccga 
cggaggctgc 
agcatatgtg 
gcaaccccgc 
cccaacatac 
ecagcgctgc 
gccttgggaa 
tcgtggcctt 
tccctgctat 
gtcggcacgt 
cttcgcgggg 
gtgtcactca 
ggetcaacga 
ggatatgcac 
tgccgggagt 
gcatcatgca 
ccatgaggat 
acgcgtacac 
ggcgggtggc 
cgggcatgac 
cagaagtgga 
aggaggtcac 
agcccgaacc 
cggagacggc 
ctagccagct 
acgctgacct 
gcgtggagtc 
aggatgagag 
gagcgatgcc 
acccggacta 
cgataccacc 
ccttggcgga 
gcacggcaac 
agtcgtactc 
ggtcttggtc 
acacatggac 
atgcactgag 
gcgcaagcct 
accgggacgt 
ccgtggagga 
gggcaaagga 
aggacttgct 
ttttctgcgt 
atttgggggt 
aggccgtgat 
Cggtgaatgc 
ttgactcaac 
acttggcccc 
gccccctgac 
taccgacgac 



gctgtccggc 
accaactagc 
cgatttcgac 
ggacccgacc 
gcggcgaggc 
acggccctcg 
ttggtacgag 

agggttgccc 

ccacatagac 
ggtagcatac 
aatgtggaag 
taggctggga 
ggcatgcatg 
cctagcagct 
catcttgtcc 
tgagatggaa 
acaattcaaa 
tgctcccgtg 
gaatttcatc 
gatagcatca 
cctccCgttt 
ttctgctttc 
ggtgcttgtg 
taaggtcatg 
cctctcccct 
gggcccaggg 
taaccacgtc 
gatcctctct 
ggactgctcc 
ggtgttgact 
ccccttcttc 
aaccacctgc 
cgtggggect 
cacgggcccc 
tgctgaggag 
cactgacaac 
tggggtgcgg 
attcctggtc 
ggacgtagca 
taagcgtagg 
gtctgcgcct 
catcgaggcc 
agaaaataag 
ggaagtatcc 
catatgggca 
cgtccctcca 
tccacggagg 
gctcgccaca 
ggcctctcct 
ctccatgccc 
taccgtaagc 
aggcgccctg 
caactctttg 
gcggcagaag 
gctcaaggag 
agcctgtaag 
cgtccggaac 
ggaagacact 
ccaaccagag 
tcgtgtgtgc 
gggctettca 
ctggaaagcg 
ggtcactgag 
cgaagccaga 
taattctaaa 
cagctgcggt 



3600 
3660 
3720 
3780 
3640 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4660 
4740 
4800 
4860 
4920 
4980 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 
5760 
5820 
5880 
5940 
6000 
6060 
6120 
6180 
6240 
6300 
6360 
6420 
6480 
6540 
6600 
6660 
6720 
6780 
684 0 
6900 
6960 
7020 
7080 
7140 
7200 
7260 
7320 
7380 
7440 
7500 
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aataccctca catgttactt gaaggccgct 
tgcacgatgc tcgtatgcgg agacgacctt 
gaggacgagg cgagcctacg ggccttcacg 
ggggacccgc ccaaaccaga atacgacttg 
tcagtcgcgc acgatgcatc tggcaaaagg 
ccccttgcgc gggctgcgtg ggagacagct 
aacatcatca tgtatgcgcc caccttgtgg 
tccatccttc tagctcagga acaacttgaa 
tgttactcca ttgagccact tgacctacct 
gcattttcac tccatagtta ctctccaggt 
aaacttgggg taccgccctt gcgagtctgg 
ctactgtccc agggggggag ggctgccact 
aggaccaagc tcaaactcac tccaatcccg 
ttcgttgctg gttacagcgg gggagacata 
tggttcatgt ggtgcctact cctactttct 
cgatgaacgg ggagctaaac actccaggcc 
tttttctttt tttttttttt tttttttttt 
ttttcctttt ctttcctttg gtggctccat 
gtccgtgagc cgcttgactg cagagagtgc 



gcggcctgtc gagctgcgaa gctccaggac 7560 
gtcgttatct gtgaaagcgc ggggacccaa 7 620 
gaggctatga ctagatactc tgccccccct 7680 
gagttgataa catcatgctc ctccaatgtg 77 40 
gtgtactatc tcacccgtga ccccaccacc 7800 
agacacactc cagtcaattc ctggctaggc 7860 
gcaaggatga tcctgatgac tcatttcttc 7920 
aaagccctag attgtcagat ctacggggcc 7980 
cagatcattc aacgactcca tggccttagc 8040 
gagatcaata gggtggcttc atgcctcagg 8100 
agacatcggg ccagaagtgt ccgcgctagg 8160 
tgtggcaagt acctcttcaa ctgggcagta 8220 
gctgcgtccc agttggattt atccagctgg 8280 
tatcacagcc tgtctcgtgc ccgaccccgc 8340 
gtaggggtag gcatctatct actccccaac 8400 
aataggccat cctgtttttt tccctttttt 8460 
tttttttttt ctcctttttt tttcctcttt 8520 
cttagcccta gtcacggcta gctgtgaaag 8580 
tgatactggc ctctctgcag atcaagt 8637 
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<210> 3 
<211> 8001 
<212> DNA 

<213> Hepatitis C Virus 
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<400> 3 

gccagccccc 

tcttcacgca 

cccccctccc 

gacgaccggg 

gcgagactgc 

gtgcttgcga 

ctcaaagaaa 

acgcaggttc 

caatcggctg 

ttgtcaagac 

egtggctggc 

gaagggactg 

Ctcctgccga 

cggctacctg 

tggaagccgg 

ccgaactgtt 

atggcgatgc 

actgtggccg 

ttgctgaaga 

ctcccgattc 

cagaccacaa 

aacgttactg 

tccaccatat 

acgagcattc 

gtgaaggaag 

tgcaggcagc 

taagatacac 

gaaagagtca 

gtaccccatt 

tcgaggttaa 

cacgataata 

tgcatcatca 

gtctccaccg 

tatcatggtg 

accaatgtgg 

ccatgcacct 

gtgcgccggc 

aagggctctt 

gctgccgtgt 

gaaaccacta 

acattccagg 

gctgcgtatg 

ctaggtttcg 

gtaaggacca 

gacggtggtt 

gactcgacca 

cgactcgtcg 

atcgaggagg 

atcgagacca 

gagctcgccg 

gatgtatccg 

acgggcttta 

gtcgacttca 

gtgtcacgct 

gtgactccag 

gacgcgggct 

tacctaaaca 

tttacaggcc 

aacttcccct 



gattgggggc 
gaaagcgtct 
gggagagcca 
tcctttcttg 
tagccgagta 
gtgccccggg 
aaccaaacgt 
tccggccgct 
ctctgatgcc 
cgacctgtcc 
cacgacgggc 
gctgctattg 
gaaagtatcc 
cccattcgac 
tcttgtcgat 
cgccaggctc 
ctgcttgccg 
gctgggtgtg 
gcttggcggc 
gcagcgcatc 
eggtttccct 
gccgaagccg 
tgccgtcttt 
ctaggggtct 
cagttcctct 
ggaacccccc 
ctgcaaaggc 
aatggctctc 
gtatgggatc 
aaaacgtcta 
ccatggcgcc 
ctagcctcac 
caacacaatc 
ccggctcaaa 
accaggacct 
gcggcagctc 
ggggcgacag 
cgggcggtcc 
gcacccgagg 
tgcggtcccc 
tggcccatct 
cagcccaagg 
gggcgtatat 
tcaccacggg 
gctctggggg 
ctatcctggg 
tgctcgccac 
tggctctgtc 
tcaagggggg 
cgaagctgtc 
tcataccaac 
ccggcgattt 
gcctggaccc 
cgcagcggcg 
gagaacggcc 
gtgcttggta 
caccagggtt 
tcacccacat 
acctggtagc 



gacactccac 
agccatggcg 
tagtggtctg 
gatcaacccg 
gtgttgggtc 
aggtctcgta 
aacaccaacg 
tgggtggaga 
gccgtgttcc 
ggtgccctga 
gttccttgcg 
ggcgaagtgc 
atcatggctg 
caccaagcga 
caggatgatc 
aaggcgcgca 
aatatcatgg 
gcggaccgct 
gaatgggctg 
gccttctatc 
ctagcgggat 
cttggaataa 
tggcaatgtg 
ttcccctctc 
ggaagcttct 
acctggcgac 
ggcacaaccc 
ctcaagcgta 
tgatctgggg 
ggccccccga 
tattacggcc 
aggccgggac 
tttcctggcg 
gacccttgcc 
cgtcggctgg 
ggacctttac 
cagggggagc 
actgctctgc 
ggttgcgaag 
ggtcttcacg 
acacgcccct 
gtataaggtg 
gtctaaggca 
tgcccccatc 
cgcctatgac 
catcggcaca 
cgctacgcct 
cagcactgga 
gaggcacctc 
cggcctcgga 
tagcggagac 
cgactcagtg 
gaccttcacc 
aggcaggact 
ctcgggcatg 
cgagctcacg 
gcccgtctgc 
agacgcccat 
ataccaggct 



catagatcac 
ttagtatgag 
cggaaccggt 
ctcaatgcct 
gcgaaaggcc 
gaccgtgcac 
ggcgcgccat 
ggctattcgg 
ggctgtcagc 
atgaactgca 
cagctgtgct 
cggggcagga 
atgcaatgcg 
aacatcgcat 
tggacgaaga 
tgcccgacgg 
tggaaaatgg 
atcaggacat 
accgcttcct 
gccttcttga 
caattccgcc 
ggccggtgtg 
agggcccgga 
gccaaaggaa 
tgaagacaaa 
aggtgcctct 
cagtgccacg 
ttcaacaagg 
cctcggtgca 
accacggqga 
tactcccaac 
aggaaccagg 
acctgcgtca 
ggcccaaagg 
caagcgcccc 
ttggtcacga 
ctactctccc 
ccctcggggc 
gcggtggact 
gacanctcgt 
actggtagcg 
cttgtcctga 
catggtatcg 
acgtactcca 
atcataatat 
gtcctggacc 
ccgggatcgg 
gaaatcccct 
attttctgcc 
ctcaatgctg 
gtcattgtcg 
atcgactgca 
attgagacga 
ggtaggggca 
ttcgattcct 
cccgccgaga 
caggaccatc 
ttcttgtccc 
acggtgtgcg 



tcccctgtga 
tgtcgtgcag 
gagtacaccg 
ggagatttgg 
ttgtggtact 
catgagcacg 
gattgaacaa 
ctatgactgg 
gcaggggcgc 
ggacgaggca 
cgacgttgtc 
tctcctgtca 
gcggctgcat 
cgagcgagca 
gcatcagggg 
cgaggatctc 
ccgcttttct 
agcgttggct 
cgtgctttac 
cgagttcttc 
cctctccctc 
cgtttgtcta 
aacctggccc 
tgcaaggtct 
caacgtctgt 
gcggccaaaa 
ttgtgagttg 
ggctgaagga 
catgctttac 
cgtggttttc 
agacgcgagg 
tcgaggggga 
atggcgtgtg 
gcccaatcac 
ccggggcgcg 
ggcatgccga 
ccaggcccgt 
acgctgtggg 
ttgtacccgt 
cccctccggc 
gcaagagcac 
acccgtccgt 
accctaacat 
cctatggcaa 
gtgatgagtg 
aagcggagac 
tcaccgtgcc 
tttatggcaa 
attccaagaa 
tagcatatta 
tagcaacgga 
atacatgtgt 
cgaccgtgcc 
ggatgggcat 
cggttctgtg 
cctcagttag 
tggagttctg 
agactaagca 
ccagggctca 



ggaactactg 
cctccaggac 
gaattgccag 
gcgtgccccc 
gcctgatagg 
aatcctaaac 
gatggattgc 
gcacaacaga 
ccggttcttt 
gcgcggctat 
actgaagcgg 
tctcaccttg 
acgcttgatc 
cgtactcgga 
ctcgcgccag 
gtcgtgaccc 
ggattcatcg 
acccgtgata 
ggtatcgccg 
tgagtttaaa 
ccccccccct 
tatgttattt 
tgtcttcttg 
gttgaatgtc 
agcgaccctt 
gccacgtgta 
gatagttgtg 
tgcccagaag 
atgtgtttag 
ctttgaaaaa 
cctacttggc 
ggtccaagtg 
ttggactgtc 
ccaaatgtac 
ttccttgaca 
tgtcattccg 
ctcctacttg 
catctttcgg 
cgagtctatg 
cgtaccgcag 
taaggtgceg 
cgccgccacc 
cagaaccggg 
gtttcttgcc 
ccactcaact 
ggctggagcg 
acatccaaac 
agccatcccc 
gaaatgtgat 
ccggggcctt 
cgctctaatg 
cacccagaca 
acaagacgcg 
ttacaggttt 
cgagtgctat 
gttgcgggct 
ggagagcgtc 
ggcaggagac 
ggctccacct 



60 

120 

180 

240 

300 

360 

420 

4B0 

540 

600 

660 

720 

760 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 
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ccatcgtggg accaaatgtg 
acgcccctgc tgtataggct 
accaaataca tcatggcatg 
ctggtaggcg gagtcctagc 
attgtgggca ggatcatctt 
taccgggagt tcgatgagat 
atgcagctcg ccgaacaatt 
caagcggagg ctgctgctcc 
gcgaagcata tgtggaattt 
cctggcaacc ccgcgatagc 
accacccaac ataccctcct 
cctcccagcg ctgcttctgc 
ataggccttg ggaaggtgct 
gcgctcgtgg cctttaaggt 
ctactccctg ctatcctctc 
ctgcgtcggc acgtgggccc 
ttcgcttcgc ggggtaacca 
gcacgtgtca ctcagatcct 
cagtggatca acgaggactg 
gattggatat gcacggtgtt 
cgattgccgg gagtcccctt 
gacggcatca tgcaaaccac 
ggttccatga ggatcgtggg 
attaacgcgt acaccacggg 
ctgtggcggg tggctgctga 
gtgacgggca tgaccactga 
ttcacagaag tggatggggt 
cgggaggagg tcacattcct 
tgcgagcccg aaccggacgt 
acggcggaga cggctaagcg 
tcagctagcc agctgtctgc 
ccggacgctg acctcatcga 
acccgcgtgg agtcagaaaa 
gaggaggatg agagggaagt 
cctcgagcga tgcccatatg 
aaggacccgg actacgtccc 
cctccgatac cacctccacg 
tctgccttgg cggagctcgc 
agcggcacgg caacggcctc 
gttgagtcgt actcctccat 
gacgggtctt ggtctaccgt 
tcctacacat ggacaggcgc 
atcaatgcac tgagcaactc 
cgcagcgcaa gcctgcggca 
cactaccggg acgtgctcaa 
ctatccgtgg aggaagcctg 
tatggggcaa aggacgtccg 
tggaaggact tgctggaaga 
gaggttttct gcgtccaacc 
ccagatttgg gggttcgtgt 
cctcaggccg tgatgggctc 
ttcctggtga atgcctggaa 
tgttttgact caacggtcac 
tgtgacttgg cccccgaagc 
gggggccccc tgactaattc 
ggtgtactga cgaccagctg 
tgtcgagctg cgaagctcca 
atctgtgaaa gcgcggggac 
atgactagat actctgcccc 
ataacatcat gctcctccaa 
tatctcaccc gtgaccccac 
actccagtca attcctggct 
atgatcctga tgactcattt 
ctagattgtc agatctacgg 
attcaacgac tccatggcct 
aatagggtgg cttcatgcct 



gaagtgtctc atacggctaa 
gggagccgtt eaaaacgagg 
catgtcggct gacctggagg 
agctctggcc gcgtattgcc 
gtccggaaag ccggccatca 
ggaagagtgc gcctcacacc 
caaacagaag gcaatcgggt 
cgtggtggaa tccaagtggc 
catcagcggg atacaatatt 
atcactgatg gcattcacag 
gtttaacatc ctggggggat 
tttcgtaggc gccggcatcg 
tgtggatatt ttggcaggtt 
catgagcggc gagatgccct 
ccctggcgcc ctagtcgtcg 
aggggagggg gctgtgcagt 
cgtctcccce acgcactatg 
ctctagtctt accatcactc 
ctccacgcca tgctccggct 
gactgatttc aagaectggc 
cttctcatgt caacgtgggt 
ctgcccatgt ggagcacaga 
gcctaggacc tgtagtaaca 
cccctgcacg ccctccccgg 
ggagtacgtg gaggttacgc 
caacgtaaag tgcccgtgtc 
gcggttgcac aggtacgctc 
ggtcgggctc aateaataee 
agcagtgctc acttccatgc 
taggctggec aggggatctc 
gccttccttg aaggcaacat 
ggccaacctc ctgtggcggc 
taaggtagta attttggact 
atccgttccg gcggagatcc 
ggcacgcccg gattacaacc 
tccagtggta cacgggtgtc 
gaggaagagg acggttgtcc 
cacaaagacc ttcggcagct 
tcctgaccag ccctccgacg 
gccccccctt gagggggagc 
aagcgaggag gctagtgagg 
cctgatcacg ccatgcgctg 
tttgctccgt caccacaact 
gaagaaggtc acctttgaca 
ggagatgaag gcgaaggcgt 
taagctgacg cccccacatt 
gaacctatcc agcaaggccg 
cactgagaca ccaattgaca 
agagaagggg ggccgcaagc 
gtgcgagaaa atggcccttt 
ttcatacgga ttccaatact 
agcgaagaaa tgccctatgg 
tgagaatgac atccgtgttg 
cagacaggcc ataaggtcgc 
taaagggcag aactgcggct 
cggtaatacc ctcacatgtt 
ggactgcacg atgctcgtat 
ccaagaggac gaggcgagcc 
ccctggggac ccgcccaaac 
tgtgtcagtc gcgcacgatg 
cacccccctt gcgcgggctg 
aggcaacatc atcatgtatg 
cttctccatc cttctagctc 
ggcctgttac tccattgagc 
tagcgcattt tcactccata 
caggaaactt ggggtaccgc 



agcctacgct gcacgggcca 3600 
ttactaccac acaccccata 3660 
tcgtcacgag cacctgggtg 3720 
tgacaacagg cagcgtggtc 3780 
ttcccgacag ggaagtcctt 3840 
tcccttacat cgaacaggga 3900 
tgctgcaaac agccaccaag 3960 
ggaccctcga agccttctgg 4020 
tagcaggctt gtccactctg 4080 
cctctatcac cagcccgctc 4140 
gggtggccge ccaacttget 4200 
ctggagcggc tgttggcagc 4260 
atggagcagg ggtggcaggc 4320 
ccaccgagga cctggttaac 4380 
gggtcgtgtg cgcagcgata 4440 
ggatgaaccg gctgatagcg 4500 
tgcctgagag cgacgctgca 4 560 
agctgctgaa gaggcttcac 4620 
cgtggctaag agatgtttgg 4680 
tccagtccaa gctectgeeg 474 0 
acaagggagt ctggcggggc 4800 
tcaccggaca tgtgaaaaac 4860 
cgtggcatgg aacattcccc 4920 
cgccaaatta ttctagggcg 4980 
gggtggggga Cttccactac 5040 
aggttccggc ccccgaattc 5100 
cagcgtgcaa acccctccta 5160 
tggttgggte aeagctccca 5220 
tcaccgaccc ctcccacatt 5280 
ccccctcctt ggccagctca 534 0 
gcactacccg tcatgactcc 5400 
aggagatggg cgggaacatc 5460 
ctttcgagcc gctccaagcg 5520 
tgcggaggtc caggaaattc 5580 
ctccactgtt agagtcctgg 5640 
cattgccgcc tgccaaggcc 5700 
tgtcagaatc taccgtgtct 5760 
ccgaatcgtc ggccgtcgac 5820 
acggcgacgc gggatccgac 5880 
cgggggatcc cgatctcagc 594 0 
acgtcgtctg ctgctcgatg 6000 
cggaggaaac caagctgccc 6060 
tggtctatgc tacaacatct 6120 
gactgcaggt cctggacgac 6180 
ccacagttaa ggctaaactt 6240 
cggccagatc taaatttggc 6300 
ttaaccacat ccgctccgtg 6360 
ccaccatcat ggcaaaaaat 6420 
cagctcgcct tatcgtattc 648 0 
acgatgtggt ctccaccctc 6540 
ctcctggaca gcgggtcgag 6600 
gcttcgcata tgacacccgc 6660 
aggagtcaat ctaccaatgt 6720 
tcacagagcg gctttacatc 6780 
atcgccggtg ccgcgcgagc 684 0 
acttgaaggc cgctgcggcc 6900 
gcggagacga ccttgtcgtt 6960 
tacgggcctt cacggaggct 7020 
cagaatacga cttggagttg 7080 
catctggcaa aagggtgtac 714 0 
cgtgggagac agctagacac 7200 
cgcccacctt gtgggcaagg 7260 
aggaacaact tgaaaaagcc 7320 
cacttgacct acctcagatc 7380 
gttactctcc aggtgagatc 7440 
ccttgcgagt ctggagacat 7500 



36 



EP 1 043 399 A2 



cgggccagaa gtgtccgcgc taggctactg 
aagtacctct tcaactgggc agtaaggacc 
tcccagttgg atttatccag ctggttcgtt 
agcctgtctc gtgcccgacc ccgctggttc 
gtaggcatct atctactccc caaccgatga 
ccatcctgtt tttttccctt tttttttttc 
ttttctcctt tttttttcct ctttttttcc 
cctagtcacg gctagctgtg aaaggtccgt 
tggcctctct gcagatcaag t 



tcccaggggg ggagggctgc cacttgtggc 7560 
aagctcaaac tcactccaat cccggctgcg 7620 
gctggttaca gcgggggaga catatatcac 7680 
atgtggtgcc tactcctact ttctgtaggg 7740 
acggggagct aaacactcca ggccaatagg 7800 
tttttttttt tttttttttt tttttttttt 7860 
ttttctttcc tttggtggct ccatcttagc 7920 
gagccgcttg actgcagaga gtgctgatac 7980 

6001 
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<2L0> 4 
<211> 7989 
<212> DNA 

s <213> Hepatitis C Virus 

<40O> 4 

gecagccccc gattgggggc gacactccac catagatcac tcccctgtga ggaactactg 60 
tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 
cccccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 180 
gacgaccggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgccccc 240 

10 gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 

gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 
ctcaaagaaa aaccaaaggg cgcgccatga ttgaacaaga tggattgcac gcaggttctc 420 
cggccgcttg ggtggagagg ctattcggct atgactgggc acaacagaca atcggctgct 480 
ctgatgccgc cgtgttccgg ctgtcagcgc aggggcgccc ggttcttttt gtcaagaccg 540 
acctgtccgg tgccctgaat gaactgcagg acgaggcagc gcggctatcg tggctggcca 600 
cgacgggcgt tccttgcgca gctgtgctcg acgttgtcac tgaagcggga agggactggc 660 
tgctattggg cgaagtgccg gggcaggatc tcctgtcatc tcaccttgct cctgccgaga 720 
aagtatccat catggctgat gcaatgcggc ggctgcatac gcttgatccg gctacctgcc 780 
cattcgacca ccaagcgaaa catcgcatcg agcgagcacg tactcggatg gaagccggtc 840 
ttgtcgatca ggatgatctg gacgaagagc atcaggggct cgcgeeagcc gaactgttcg 900 
ccaggctcaa ggcgcgcatg cccgacggcg aggatctcgt cgtgacccat ggcgatgcct 960 
gcttgccgaa tafccatggtg gaaaatggcc gcttttctgg attcatcgac tgtggccggc 1020 

20 tgggtgtggc ggaccgctat caggacatag cgttggctac ccgtgatatt gctgaagagc 1080 

ttggcggcga atgggctgac cgcttcctcg tgctttacgg tatcgccgct ceegattcgc 1140 
agcgcatcgc cttctatcgc cttcttgacg agttcttctg agtttaaaca gaccacaacg 1200 
gtttccctct agcgggatca attccgccce tctccctccc ccccccctaa egttactggc 1260 
cgaagccgct tggaataagg ccggtgtgcg tttgtctata tgttattttc caccatattg 1320 
ecgtcttttg gcaatgtgag ggcccggaaa cctggccctg tcttcttgac gagcattcct 1380 

2S aggggtcttt cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt gaaggaagca 1440 

gttcctctgg aagcttcttg aagacaaaca acgtctgtag cgaccctttg caggcagcgg 1500 
aaccccccac ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata agatacacct 1560 
gcaaaggcgg cacaacccca gtgccacgtt gtgagttgga tagttgtgga aagagtcaaa 1620 
tggctctcct caagcgtatt caacaagggg ctgaaggatg cccagaaggt accccattgt 1680 
atgggatctg atctggggec tcggtgcaca tgctttacat gtgtttagtc gaggttaaaa 1740 
aacgtctagg ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgataatacc 1800 

30 atggcgccta ttacggccta ctcccaacag acgcgaggcc tacttggctg catcatcact 1860 

agcctcacag gccgggacag gaaceaggtc gagggggagg tccaagtggt ctccaccgca 1920 
acacaatctt tcctggcgac ctgcgtcaat ggcgtgtgtt ggactgtcta tcatggtgcc 1980 
ggcteaaaga cccttgccgg cccaaagggc ccaatcaccc aaatgtacac caatgtggac 2040 
caggacctcg tcggctggca agcgcccccc ggggcgcgtt ccttgacacc atgcacctgc 2100 
ggcagctcgg acctttactt ggtcacgagg catgccgatg tcattccggt gcgccggcgg 2160 

35 ggcgacagca gggggagcct actctccccc aggcccgtct cctacttgaa gggctcttcg 2220 

ggeggtccae tgctctgccc ctcggggcac gctgtgggca tctttcgggc tgccgtgtgc 2280 
acccgagggg ttgcgaaggc ggtggacttt gtaccegtcg agtctatgga aaccactatg 2340 
cggtccccgg tettcacgga caactcgtcc cctccggccg taccgcagac attccaggtg 2400 
gcccatctac acgcccctac tggtagcggc aagagcacta aggtgccggc tgcgtatgca 2460 
gcccaagggt ataaggtgct tgtcctgaac ccgtccgtcg ccgccaccct aggtttcggg 2520 
gcgtatatgt ctaaggcaca tggtatcgac cctaacatca gaaccggggt aaggaccatc 2580 

40 accacgggtg cccccatcac gtactccacc tatggcaagt ttcttgccga cggtggttgc 2640 

tctgggggcg cctatgacat cataatatgt gatgagtgcc actcaactga ctcgaccact 2700 
atcctgggca tcggcacagt cctggaccaa gcggagacgg ctggagcgcg actcgtcgtg 2760 
ctcgccaccg ctacgcctcc gggatcggtc accgtgccac atccaaacat cgaggaggtg 2820 
gctctgtcca gcactggaga aatccccttt tatggcaaag ccatccccat cgagaccatc 2880 
aaggggggga ggcacctcat tttctgccat tccaagaaga aatgtgatga gctcgccgcg 2940 

45 aagctgtccg gcctcggact caatgctgta gcatattacc ggggccttga tgtatccgtc 3000 

ataccaacta gcggagacgt cattgtcgta gcaacggacg ctctaatgac gggctttacc 3060 
ggcgatttcg actcagtgat cgactgcaat acatgtgtea cccagacagt cgacttcagc 3120 
ctggacccga ccttcaccat tgagacgacg accgtgccac aagacgcggt gtcacgctcg 3180 
cagcggcgag gcaggactgg taggggcagg atgggcattt acaggtttgt gactccagga 3240 
gaacggccct cgggcatgtt cgattcctcg gttctgtgcg agtgctatga cgcgggctgt 3300 
gcttggtacg agctcacgcc cgccgagacc tcagttaggt tgcgggctta cctaaacaca 3360 
K ccagggttgc ccgtctgcca ggaccatctg gagttctggg agagcgtctt tacaggcctc 3420 

acccacatag acgcccattt cttgtcccag actaagcagg caggagacaa cttcccctac 3480 
ctggtagcat accaggctac ggtgtgcgcc agggctcagg ctccacctcc atcgtgggac 3540 
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10 



15 



20 



25 



30 



35 



40 



45 



50 



caaatgtgga 
tataggetgg 
atggcatgca 
gtcctagcag 
atcatcttgt 
gatgagatgg 
gaacaattca 
gctgctcccg 
tggaatttca 
gcgatagcat 
accctcctgt 
gcttctgctt 
aaggtgcttg 
tttaaggtca 
atcctctccc 
gtgggcccag 
ggtaaccacg 
cagatcctct 
gaggactgct 
acggtgttga 
gtccccttct 
caaaccacct 
atcgtggggc 
accacgggcc 
gctgctgagg 
accactgaca 
gatggggtgc 
acattcctgg 
ccggacgtag 
getaagcgta 
ctgtctgcgc 
ctcatcgagg 
tcagaaaata 
agggaagtat 
cccatatggg 
tacgtccctc 
cctccacgga 
gagctcgcca 
acggcctctc 
tcctccatgc 
tctaccgtaa 
acaggcgccc 
agcaactctt 
etgcggcaga 
gtgctcaagg 
gaagcctgta 
gacgtccgga 
ctggaagaca 
gtccaaccag 
gttcgtgtgt 
atgggctctt 
gcctggaaag 
acggtcactg 
cccgaagcca 
actaattcta 
accagctgcg 
aagctccagg 
gcggggaccc 
tctgcccccc 
tcctccaatg 
gaccccacca 
tcctggctag 
actcatttct 
atctacgggg 
catggcctta 
tcatgcctca 



agtgtctcat 
gagccgttea 
tgtcggctga 
ctctggccgc 
ccggaaagcc 
aagagtgcgc 
aacagaaggc 
tggtggaatc 
tcagcgggat 
cactgatggc 
ttaacatcct 
tcgtaggcgc 
tggatatttt 
tgagcggcga 
ctggcgccct 
gggagggggc 
tctcccccac 
ctagtcttac 
ccacgccatg 
ctgatttcaa 
tctcatgtca 
gcccatgtgg 
ctaggacctg 
cctgcacgec 
agtacgtgga 
acgtaaagtg 
ggttgcacag 
tcgggctcaa 
cagtgctcac 
ggctggccag 
cttccttgaa 
ccaacctcct 
aggtagtaat 
ccgttccggc 
cacgcccgga 
cagtggtaca 
ggaagaggac 
caaagacctt 
ctgaccagcc 
ccccccttga 
gcgaggaggc 
tgatcacgcc 
tgctccgtca 
agaaggtcac 
agatgaaggc 
agctgacgcc 
acctatccag 
ctgagacacc 
agaagggggg 
gcgagaaaat 
catacggatt 
cgaagaaatg 
agaatgacat 
gacaggccat 
aagggcagaa 
gtaataccct 
actgcacgat 
aagaggacga 
ctggggaccc 
tgtcagtcgc 
ccccccttgc 
gcaacatcat 
tctccatcct 
cccgttactc 
gcgcattttc 
ggaaacttgg 



acggctaaag 
aaacgaggtt 
cctggaggtc 
gtattgcctg 
ggccatcatt 
ctcacacctc 
aatcgggttg 
caagtggcgg 
acaatattta 
attcacagcc 

ggggggatgg 

cggcatcgct 
ggcaggttat 
gatgccctcc 
agtcgtcggg 
tgtgcagtgg 
gcactatgtg 
catcactcag 
ctccggeteg 
gacctggctc 
acgtgggtac 
agcacagatc 
tagtaacacg 
ctccccggcg 
ggttacgcgg 
cccgtgtcag 
gtacgctcca 
tcaatacctg 
ttccatgctc 
gggatctccc 
ggcaacatgc 
gtggcggcag 
tttggactct 
ggagatcctg 
ttacaaccct 
cgggtgtcca 
ggttgtcctg 
cggcagctcc 
ctccgacgac 
gggggagccg 
tagtgaggac 
atgcgctgcg 
ccacaacttg 
ctttgacaga 
gaaggcgtcc 
cccacattcg 
caaggccgtt 
aattgacacc 
ccgcaagcca 
ggccctttac 
ccaatactct 
ccctatgggc 
ccgtgttgag 
aaggtcgctc 
ctgcggctat 
cacatgttac 
gctcgtatgc 
ggcgagccta 
gcccaaacca 
gcacgatgca 
gcgggctgcg 
catgtatgcg 
tctagctcag 
cattgagcca 
actccatagt 
ggtaccgccc 



cctacgctgc 
actaccacac 
gbcacgagca 
acaacaggca 
cccgacaggg 
ccttacatcg 
ctgcaaacag 
accctcgaag 
gcaggcttgt 
tctatcacca 
gtggccgccc 
ggagcggctg 
ggagcagggg 
accgaggacc 
gtcgtgtgcg 
atgaaccggc 
cctgagagcg 
ctgctgaaga 
tggctaagag 
cagtccaagc 
aagggagtct 
accggacatg 
tggcatggaa 
ccaaattatt 
gtgggggatt 
gttccggccc 
gcgtgcaaac 
gttgggtcae 
accgacccct 
ccctccttgg 
actacccgtc 
gagatgggcg 
ttcgagccgc 
cggaggtcca 
ccactgttag 
ttgccgcctg 
tcagaatcta 
gaatcgtcgg 
ggcgacgcgg 
ggggatcccg 
gtcgtctgct 
gaggaaacca 
gtctatgcta 
ctgcaggtcc 
acagttaagg 
gccagatcta 
aaccacatcc 
accatcatgg 
gctcgcctta 
gatgtggtct 
cctggacagc 
ttegcatatg 
gagtcaatct 
acagagcggc 
cgccggtgcc 
ttgaaggccg 
ggagacgacc 
cgggccttca 
gaatacgact 
tctggcaaaa 
tgggagacag 
cccaccttgt 
gaacaacttg 
Cttgacctac 
tactctccag 
ttgcgagtct 



acgggccaac 
accccataac 
cctgggtgct 
gcgtggtcat 
aagtccttta 
aacagggaat 
ccaccaagca 
ccttctgggc 
ccactctgcc 
gcccgctcac 
aacttgctcc 
ttggcagcac 
tggcaggcgc 
tggttaacct 
cagcgatact 
tgatagcgtt 
acgctgcagc 
ggcttcacca 
atgtttggga 
tcctgccgcg 
ggcggggcga 
tgaaaaacgg 
cattccccat 
ctagggcgct 
tccaccacgt 
ccgaattctt 
ccctcctacg 
agctcccatg 
cccacattac 
ccagctcatc 
atgactcccc 
ggaacatcac 
tccaagcgga 
ggaaattccc 
agtcetggaa 
ccaaggcccc 
ccgtgtcttc 
ccgtcgacag 
gatccgacgt 
atctcagcga 
gctcgatgtc 
agctgcccat 
caaeatctcg 
tggacgacca 
ctaaacttct 
aatttggcta 
gctccgtgtg 
caaaaaatga 
tcgtattccc 
ccaccctccc 
gggtcgagtt 
acacccgctg 
accaatgttg 
tttacatcgg 
gcgcgagcgg 
ctgcggcctg 
ttgtcgttat 
cggaggctat 
tggagttgat 
gggtgtacta 
ctagacacac 
gggcaaggat 
aaaaagccct 
ctcagatcat 
gtgagatcaa 
ggagacatcg 



gcccctgctg 
caaatacatc 
ggtaggcgga 
tgtgggcagg 
ccgggagttc 
gcagctcgcc 
agcggaggct 
gaagcatatg 
tggcaacccc 
cacccaacat 
tcccagcgct 

aggccttggg 
gctcgtggcc 
actccctgct 
gcgtcggcac 
cgcttcgcgg 
acgtgtcact 
gCggatcaac 
ttggatatgc 
ottgccggga 
cggcatcatg 
ttceatgagg 
taacgcgtac 
gtggcgggtg 
gacgggcatg 
cacagaagtg 
ggaggaggtc 
cgagcccgaa 
ggcggagacg 
agctagccag 
ggacgctgac 
ccgcgtggag 
ggaggatgag 
tcgagcgatg 
ggacccggac 
tccgatacca 
tgccttggcg 
cggcacggca 
tgagtcgtac 
cgggtcttgg 
ctacacatgg 
caatgcactg 
cagcgcaagc 
ctaccgggac 
atccgtggag 
tggggcaaag 
gaaggacttg 
ggttttctgc 
agatttgggg 
tcaggccgtg 
cctggtgaat 
ttttgactca 
tgacttggcc 
gggccccctg 
tgtactgacg 
tcgagctgcg 
ctgtgaaagc 
gactagatac 
aacatcatgc 
tctcacccgt 
tccagtcaat 
gatcctgatg 
agattgtcag 
tcaacgactc 
tagggtggct 
ggccagaagt 



3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 
5760 
5820 
5880 
5940 
6000 
6060 
6120 
6180 
6240 
6300 
6360 
6420 
6480 
6540 
6600 
6660 
6720 
6780 
6840 
6900 
6960 
7020 
7080 
7140 
7200 
7260 
7320 
7380 
7440 
7500 
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gtccgcgcta ggctactgtc ccaggggggg 
aactgggcag taaggaccaa gctcaaactc 
ttatccagct ggttcgttgc tggttacagc 
gcccgacccc gctggttcat gtggtgccta 
ctactcccca accgatgaac ggggagctaa 
tttccctttt tttttttctt tttttttttt 
tttttcctct ttttttcctt ttctttcctt 
tagctgtgaa aggtccgtga gccgcttgac 
agatcaagt 



agggctgcca cttgtggcaa gtacctcttc 7560 
actccaatcc cggctgcgtc ccagttggat 7620 
gggggagaca tatatcacag cctgtctcgt 7 660 
ctcctacttt ctgtaggggt aggcatctat 7740 
acactceagg ccaataggcc atcctgtttt 7800 
tttttttttt tttttttttt ttctcctttt 7 860 
tggtggctcc atcttagccc tagtcacggc 7920 
tgcagagagt gctgatactg gcctctctgc 7980 

7989 



40 
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<210> 5 
<211> 6649 
<212> DNA 

<213> Hepatitis C Virus 



10 



15 



20 



25 



30 



35 



40 



45 



50 



<400> 5 

gccagccccc 

tcttcacgea 

cccccctccc 

gacgaccggg 

gcgagactgc 

gtgcttgcga 

ctcaaagaaa 

acgcaggttc 

caatcggctg 

ttgtcaagac 

cgtggctggc 

gaagggactg 

ctcctgccga 

cggctacctg 

tggaagccgg 

ccgaactgtt 

atggcgatgc 

actgtggccg 

ttgctgaaga 

ctcccgattc 

cagaccacaa 

aacgttactg 

tccaccatat 

acgagcattc 

gtgaaggaag 

tgcaggcagc 

taagatacac 

gaaagagtca 

gtaccccatt 

tcgaggttaa 

cacgataata 

ctgatactct 

ttacaatatt 

gttcgggggg 

tttaccatca 

ataaccaaag 

cggaaggttg 

ggtacgtacg 

gaccttgcgg 

tggggggcag 
agggggaggg 

ctcgcgccta 
agcctcacag 
acacaatctt 
ggctcaaaga 
caggacctcg 
ggcagctcgg 
ggcgacagca 
ggcggtccac 
acccgagggg 
cggtccccgg 
gcccatctac 
gcccaagggt 
gcgtatatgt 
accacgggtg 
tctgggggcg 
atcctgggca 
ctcgccaccg 
gctctgtcca 



gattgggggc 
gaaagcgtct 
gggagagcca 
tcctttcttg 
tagccgagta 
gtgccccggg 
aaccaaacgt 
tccggccgct 
ctctgatgcc 
cgacctgtcc 
cacgacgggc 
gctgctattg 
gaaagtatcc 
cccattcgac 
tcttgtcgat 
cgccaggctc 
ctgcttgccg 
gctgggtgtg 
gcttggcggc 
gcagcgcatc 
cggtttccct 
gccgaagccg 
tgccgtcttt 
ctaggggtct 
cagttcctct 
ggoacccccc 
ctgcaaaggc 
aatggctctc 
gtatgggatc 
aaaacgtcta 
ccatggaccg 
tgaccttgtc 
ttatcaccag 
gccgcgatgc 
ccaaaatctt 
tgccgtactt 
ctgggggtca 
tttatgacca 
tggcagttga 
acaccgcggc 
agatacatct 
ttacggccta 
gccgggacag 
tcctggcgac 
cccttgccgg 
tcggctggca 
acctttactt 
gggggagcct 
tgctctgccc 
ttgcgaaggc 
tcttcacgga 
acgcccctac 
ataaggtgct 
ctaaggcaca 
cccccatcac 
cctatgacat 
tcggcacagt 
ctacgcctcc 
gcactggaga 



gacactccac 
agccatggcg 
tagtggtctg 
gatcaacccg 
gtgttgggtc 
aggtctcgta 
aacaccaacg 
tgggtggaga 
gccgtgttcc 
ggtgccctga 
gttccttgcg 
ggcgaagtgc 
atcatggctg 
caccaagcga 
caggatgatc 
aaggcgcgca 
aatatcatgg 
gcggaccgct 
gaatgggctg 
gccttctatc 
ctagcgggat 
cttggaataa 
tggcaatgtg 
ttcccctctc 
ggaagcttct 
acctggcgac 
ggcacaaccc 
ctcaagcgta 
tgatctgggg 
ggccccccga 
ggagatggca 
accgcactat 
ggccgaggca 
cgtcatcctc 
gctcgccata 
cgtgcgcgca 
ttatgtccaa 
tctcacccca 
gcccgtcgtc 
gtgtggggac 
gggaccggea 
ctcccaacag 
gaaccaggtc 
ctgcgtcaat 
cccaaagggc 
agcgcccccc 
ggtcacgagg 
actctccccc 
ctcggggcac 
ggtggacttt 
caactcgtcc 
tggtagcggc 
tgtcctgaac 
tggtatcgac 
gtactccacc 
cataatatgt 
cctggaccaa 
gggatcggtc 
aatccccttt 



catagatcac 
ttagtatgag 
cggaaccggt 
ctcaatgcct 
gcgaaaggcc 
gaccgtgcac 
ggcgcgccat 
ggctattcgg 
ggctgtcagc 
atgaactgca 
cagctgtgct 
cggggcagga 
atgcaatgcg 
aacatcgcat 
tggacgaaga 
tgcccgacgg 
tggaaaatgg 
atcaggacat 
accgcttcct 
gccttcttga 
caattccgcc 
ggccggtgtg 
agggcccgga 
gccaaaggaa 
tgaagacaaa 
aggtgcctct 
cagtgccaeg 
ttcaacaagg 
cctcggtgca 
accacgggga 
gcatcgtgcg 
aagctgttcc 
cacttgcaag 
ctcacgtgcg 
ctcggtccac 
caegggctca 
atggctctca 
ctgcgggact 
ttctctgata 
atcatcttgg 
gacagccttg 
acgcgaggcc 
gagggggagg 
ggcgtgtgtt 
ccaatcaccc 
ggggcgcgtt 
catgccgatg 
aggcccgtct 
gctgtgggca 
gtacccgtcg 
cctccggccg 
aagagcacta 
ccgtccgtcg 
cctaacatca 
tatggcaagt 
gatgagtgcc 
gcggagacgg 
accgtgccac 
tatggcaaag 



tcccctgtga 
tgtcgtgcag 
gagtacaccg 
ggagatttgg 
ttgtggtact 
catgagcacg 
gattgaacaa 
ctatgactgg 
gcaggggcgc 
ggacgaggca 
cgacgttgtc 
tctcctgtca 
gcggctgcat 
cgagcgagca 
gcatcagggg 
cgaggatctc 
ccgcttttct 
agcgttggct 
cgtgctttac 
cgagttcttc 
cctctccctc 
cgtttgtcta 
aacctggccc 
tgcaaggtct 
caacgtctgt 
gcggccaaaa 
ttgtgagttg 
ggctgaagga 
catgctttac 
cgtggttttc 
gaggcgcggt 
tcgctaggct 
tgtggatccc 
cgatccaccc 
tcatggtgct 
ttcgtgcatg 
tgaagttggc 
gggcccacgc 
tggagaccaa 
gcctgcccgt 
aagggcaggg 
tacttggctg 
tccaagtggt 
ggactgtcta 
aaatgtacac 
ccttgacacc 
tcattccggt 
cctacttgaa 
tctttcgggc 
agtctatgga 
taccgcagac 
aggtgccggc 
ccgccaccct 
gaaccggggt 
ttcttgccga 
actcaactga 
ctggagcgcg 
atccaaacat 
ccatccccat 



ggaactactg 
cctccaggac 
gaattgccag 
gcgtgccccc 
gcctgatagg 
aatcctaaac 
gatggattgc 
gcacaacaga 
ccggttcttt 
gcgcggctat 
actgaagcgg 
tctcaccttg 
acgcttgatc 
cgtactcgga 
ctcgcgccag 
gtcgtgaccc 
ggattcatcg 
acccgtgata 
ggtatcgccg 
tgagtttaaa 
ccccccccct 
tatgttattt 
tgtcttcttg 
gttgaatgtc 
agcgaccctt 
gccacgtgta 
gatagttgtg 
tgcccagaag 
atgtgtttag 
ctttgaaaaa 
tttcgtaggt 
catatggtgg 
ccccctcaac 
agagctaatc 
ccaggctggt 
catgctggtg 
cgcactgaca 
gggcctacga 
ggttatcacc 
ctccgcccgc 
gtggcgactc 
catcatcact 
ctccaccgca 
tcatggtgcc 
caatgtggac 
atgcacctgc 
gcgccggcgg 
gggctcttcg 
tgccgtgtgc 
aaccactatg 
attccaggtg 
tgcgtatgca 
aggtttcggg 
aaggaccatc 
cggtggttgc 
ctcgaccact 
actcgtcgtg 
cgaggaggtg 
cgagaccatc 



60 

120 

160 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

640 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 
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aaggggggga gycacctcat tttctgccat 
aagctgtccg gcctcggact caatgctgta 
ataccaacta gcggagacgt eattgtcgta 
ggegatttcg actcagtgat cgactgcaat 
ctggacccga ccttcaccat tgagacgacg 
cagcggcgag gcaggactgg taggggcagg 
gaacggccct cgggcatgtt cgattcctcg 
gcttggtacg agctcacgcc cgccgagacc 
ccagggttgc ccgtctgcca ggaccatctg 
acccacatag acgcccattt cttgtcccag 
ctggtagcat accaggctac ggtgtgcgcc 
caaatgtgga agtgtctcat acggctaaeg 
tataggctgg gagccgttca aaacgaggtt 
atggcatgca tgtcggctga cctggaggtc 
gtcctagcag ctctggccgc gtattgcctg 
atcatcttgt ccggaaagcc ggccatcatt 
gatgagatgg aagagtgcgc ctcacacctc 
gaacaattca aacagaaggc aatcgggttg 
gctgctcccg tggtggaatc caagtggcgg 
tggaatttca tcagcgggat acaatattta 
gcgatagcat cactgatggc attcacagcc 
accctcctgt ttaacatcct ggggggatgg 
gcttctgctt tcgtaggcgc cggcatcgct 
aaggtgcttg tggatatttt ggcaggttat 
tttaaggtca tgagcggcga gatgccctcc 
atcctctccc ctggcgccct agtcgtcggg 
gtgggcccag gggagggggc tgtgcagtgg 
ggtaaccacg tctcccccac gcactatgtg 
cagatcctct ctagtcttac catcactcag 
gaggactgct ccacgccatg ctccggctcg 
acggtgttga ctgatttcaa gacctggctc 
gtccccttct tctcatgtca acgtgggtac 
caaaccacct gcccatgtgg agcacagatc 
accgtggggc ctaggacctg tagtaacacg 
accacgggcc cctgcacgcc ctccccggcg 
gctgctgagg agtacgtgga ggttacgcgg 
accactgaca acgtaaagtg cccgtgtcag 
gatggggtgc ggttgcacag gtacgctcca 
acattcctgg tcgggctcaa tcaatacctg 
ccggacgtag cagtgctcac ttccatgctc 
gctaagcgta ggctggccag gggatctccc 
etgtetgcgc cttccttgaa ggcaacatgc 
ctcatcgagg ccaacctcct gtggcggcag 
tcagaaaata aggtagtaat tttggactct 
agggaagtat ccgttccggc ggagatcctg 
cccatatggg cacgcccgga ttacaaccct 
tacgtccctc cagtggtaca cgggtgtcca 
cctccacgga ggaagaggac ggttgtcctg 
gagctcgcca caaagacctt cggcagctcc 
acggcctctc ctgaccagcc ctccgacgac 
tcctccatgc ccccccctga gggggagccg 
tctaccgtaa gcgaggaggc tagtgaggac 
acaggcgccc tgatcacgcc atgcgctgcg 
agcaactctt tgctccgtca ccacaacttg 
ctgcggcaga agaaggtcac ctttgacaga 
gtgctcaagg agatgaaggc gaaggcgtcc 
gaagcctgta agctgacgcc cccacattcg 
gacgtccgga acctatccag caaggccgtt 
ctggaagaca ctgagacacc aattgacacc 
gtccaaccag agaagggggg ccgcaagcca 
gttcgtgtgt gcgagaaaat ggccctttac 
atgggctctt catacggatt ccaatactct 
gcctggaaag cgaagaaatg ccctatgggc 
acggtcactg agaatgacat ccgtgttgag 
cccgaagcca gacaggccat aaggtcgctc 
act.aatt.cta aagggcagaa ctgcggctat 



tccaagaaga aatgtgatga gctcgccgcg 3600 
gcatattacc ggggccttga tgtatccgtc 3660 
gcaacggacg ctctaatgac gggctttaec 3720 
acatgtgtca cccagacagt cgacttcagc 3780 
accgtgccac aagacgcggt gtcacgctcg 3840 
atgggcattt acaggtttgt gactccagga 3300 
gttctgtgcg agtgctatga cgcgggctgt 3960 
tcagttaggt tgcgggctta cctaaacaca 4020 
gagttctggg agagcgtctt tacaggcctc 4080 
actaagcagg caggagacaa cttcccctac 4140 
agggctcagg ctccacctcc atcgtgggac 4200 
cctacgctgc acgggccaac gcccctgctg 4260 
actaccacac accccataac caaatacatc 4320 
gtcacgagca cctgggtgct ggtaggcgga 4380 
acaacaggca gcgtggtcat tgtgggcagg 4440 
cccgacaggg aagtccttta ccgggagttc 4500 
ccttacatcg aacagggaat gcagctcgcc 4560 
ctgcaaacag ccaccaagca agcggaggct 4620 
accctcgaag ccttctgggc gaagcatatg 4 680 
gcaggcttgt ccactctgcc tggcaacccc 4740 
tctat caeca gcccgctcac cacccaacat 4800 
gtggccgccc aacttgctcc tcccagcgct 4 860 
ggagcggctg ttggcagcat aggccttggg 4920 
ggagcagggg tggcaggege gctcgtggcc 4980 
accgaggacc tggttaacct actccctgct 504 0 
gtegtgtgcg cagegatact gcgtcggcac 5100 
atgaacegge tgatagcgtt cgcttcgcgg 5160 
ectgagageg acgctgcagc acgtgtcact 5220 
ctgetgaaga ggcttcacca gtggatccac 5280 
tggctaagag atgtttggga ttggatatgc 5340 
cagtccaagc tcctgccgcg attgeeggga 5400 
aagggagtct ggeggggega eggcatcatg 54 60 
aceggacatg tgaaaaaegg ttccatgagg 5520 
tggcatggaa cattccccat taacgegtae 5580 
ccaaattatt etagggeget gtggcgggtg 564 0 
gtgggggatt tccactacgt gaegggcatg 5700 
gttccggccc ccgaattctt cacagaagtg 5760 
gcgtgcaaac ccctcctacg ggaggaggtc 5820 
gttgggtcac agctcccatg egagecegaa 5680 
accgacccct cccacattac ggcggagacg 5940 
ccctccttgg ccagctcatc agetagecag 6000 
actacccgtc atgactcccc ggacgetgac 6060 
gagatgggcg ggaacatcac ccgcgtggag 6120 
ttcgagccgc tecaagegga ggaggatgag 6180 
eggaggtcca ggaaattccc tegagegatg 6240 
ccactgttag agtcctggaa ggacccggac 6300 
ttgccgcctg ccaaggcccc tccgatacca 6360 
tcagaatcta ccgtgtcttc tgccttggcg 6420 
gaategtegg ccgtcgacag cggcacggca 6480 
ggegacgegg gatccgacgt tgagtegtae 654 0 
ggggatcccg atetcagega egggtcttgg 6600 
gtegtctget gctcgatgtc ctacacatgg 6660 
gaggaaacca agctgcccat caatgeactg 6720 
gtctatgeta caacatctcg eagegcaage 6780 
ctgcaggtcc tggacgacca ctaccgggac 6840 
acagttaagg ctaaacttct atccgtggag 6900 
gecagatcta aatttggcta tggggcaaag 6960 
aaccacatcc gctccgtgtg gaaggacttg 702 0 
aeeatcatgg caaaaaatga ggttttctgc 7080 
gctcgcctta tcgtattccc agatttgggg 7140 
gatgtggtct ccaccctccc teaggcegtg 7200 
cctggacagc gggtcgagtt cctggtgaat 7260 
ttcgcatatg acacccgctg ttttgactca 7320 
gagtcaatct accaatgttg tgacttggcc 7380 
acagagegge tttacategg gggccccctg 74 40 
cgccggtgcc gegegagegg tgtactgacg 7 500 



42 



EP 1 043 399 A2 



accagctgcg gtaataccct cacatgttac 
aagctccagg actgcacgat gctcgtatgc 
gcggggaccc aagaggacga ggcgagccta 
tctgcccccc ctggggaccc gcccaaacca 
tcctccaatg tgtcagtcgc gcacgatgca 
gaccccacca ccccccttgc gcgggctgcg 
tcctggctag gcaacatcat catgtatgcg 
actcatttct tctccatcct tctagctcag 
atctacgggg cctgttactc cattgagcca 
catggcctta gcgcattttc actccatagt 
tcatgcctca ggaaacttgg ggtaccgccc 
gtccgcgcta ggctactgtc ccaggggggg 
aactgggcag taaggaccaa gctcaaactc 
ttatccagct ggttcgttgc tggttacagc 
gcccgacccc gctggttcat gtggtgccta 
ctactcccca accgatgaac ggggagctaa 
tttccctttt tttttttctt tttttttttt 
tttttcctct ttttttcctt ttctttcctt 
tagctgtgaa aggtccgtga gccgcttgac 
agatcaagt 



ttgaaggccg ctgcggcctg tcgagctgcg 7560 
ggagacgacc ttgtcgttat ctgtgaaagc 7620 
cgggccttca cggaggctat gactagatac 7680 
gaatacgact tggagttgat aacatcatgc 7740 
tctggcaaaa gggtgtacta tctcacccgt 7800 
tgggagacag ctagacacac tccagtcaat 7860 
cccaccttgt gggcaaggat gatcctgatg 7920 
gaacaacttg aaaaagccct agattgtcag 7980 
cttgacctac ctcagatcat tcaacgactc 8040 
tactctccag gtgagatcaa tagggtggct 8100 
ttgcgagtct ggagacatcg ggccagaagt 8160 
agggctgcca cttgtggcaa gtacctcttc 8220 
actccaatcc cggctgcgtc ccagttggat 8280 
gggggagaca tatatcacag cctgtctcgt 8340 
ctcctacttt ctgtaggggt aggcatctat 8400 
acactccagg ccaataggcc atcctgtttt 8460 
tttttttttt tttttttttt ttctcctttt 8520 
tggtggctcc atcttagccc tagtcacggc 8580 
tgcagagagt gctgatactg gcctctctgc 864 0 

8649 
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<210> 6 
<211> 8001 
<212> DNA 

<213> Hepatitis C Virus 
<400> 6 

gccagccccc gattgggggc gacactccac 
tcttcacgca gaaagcgtct agccatggcg 
cccccctccc gggagagcca tagtggtctg 
gacgaccggg tcctttcttg gatcaacccg 
gcgagactgc tagccgagta gtgttgggtc 
gtgcttgcga gtgccccggg aggtctcgta 
etcaaagaaa aaccaaacgt aacaccaacg 
acgcaggttc tccggccgct tgggtggaga 
caatcggctg etctgatgcc gcegtgttce 
ttgtcaagac cgacctgtcc ggtgccctga 
cgtggctggc cacgacgggc gttccttgcg 
gaagggactg gctgctattg ggcgaagtgc 
ctcctgccga gaaagtatcc atcatggetg 
cggctacctg cccattcgac caccaagcga 
tggaagccgg tcttgtcgat caggatgatc 
ccgaactgtt cgccaggctc aaggcgcgca 
atggcgatgc ctgcttgccg aatateatgg 
actgtggccg gctgggtgtg gcggaccgct 
ttgctgaaga gcttggcggc gaatgggctg 
ctcccgattc gcagcgcatc gccttctatc 
cagaccacaa cggtttccct ctagcgggat 
aacgttactg gccgaagccg cttggaataa 
tccaccatat tgccgtcttt tggcaatgtg 
acgagcattc ctaggggtct ttcccctctc 
gtgaaggaag cagttcctct ggaagcttct 
tgcaggcagc ggaacccccc acctggcgac 
taagatacac ctgcaaaggc ggcacaaccc 
gaaagagtca aatggctctc ctcaagcgta 
gtaccccatt gtatgggatc tgatctgggg 
tcgaggttaa aaaacgtcta ggccccccga 
cacgataata ccatggcgec tattacggcc 
tgcatcatca ctagcctcac aggccgggac 
gtctccaccg caacacaatc tttcctggcg 
tatcatggtg ccggctcaaa gacccttgcc 
accaatgtgg accaggacct cgtcggctgg 
ccatgcacct gcggcagctc ggacctttac 
gtgcgccggc ggggcgacag cagggggagc 
aagggctctt cgggcggtcc actgctctgc 
gctgccgtgt gcacccgagg ggttgcgaag 
gaaaccacta tgcggtcccc ggtcttcacg 
acattccagg tggcccatct acacgcccct 
gctgcgtatg cagcccaagg gtataaggtg 
ctaggtttcg gggcgtatat gtctaaggca 
gtagggacca tcaccacggg tgcccccatc 
gacggtggtt gctctggggg cgcctatgac 
gactcgacca ctatcctggg catcggcaca 
cgactcgtcg tgctcgccac cgctacgcct 
atcgaggagg tggctctgtc cagcactgga 
atcgcgacca tcaagggggg gaggcacctc 
gagctcgccg cgaagctatc cggcctcgga 
gatgtatccg tcataccaac tagcggagac 
acgggcttta ccggcgattt cgactcagtg 
gtcgacttca gcctggaccc gaccttcacc 
gtgtcacgct cgcagcggcg aggcaggact 
gtgactccag gagaacggcc ctcgggcatg 
gacgcgggct gtgcttggta cgagctcacg 
tacctaaaca caccagggct gcccgtctgc 
tttacaggcc tcacccacat agacgcccat 
aacttcccct acctggtagc ataccaggct 



catagatcac tcccctgtga ggaactactg 60 
ttagtatgag tgtcgtgcag cctccaggac 120 
cggaaccggt gagtacaccg gaattgccag 100 
ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgaaaggcc ttgtggtact gcctgatagg 300 
gaccgtgcac catgagcacg aatcctaaac 360 
ggcgcgccat gattgaacaa gotggattgc 420 
ggctattcgg ctatgactgg gcacaacaga 460 
ggctgtcagc gcaggggcgc ccggttcttt 540 
atgaactgca ggacgaggca gcgcggctat 600 
cagctgtgct cgacgttgtc actgaagcgg 660 
cggggcagga tctcctgtca tctcaccttg 720 
atgcaatgeg geggctgcat acgcttgatc 780 
aacatcgcat cgagcgagca cgtactcgga 840 
tggacgaaga gcatcagggg otcgcgccag 900 
tgcccgacgg cgaggatctc gtcgtgaccc 960 
tggaaaatgg ccgcttttct ggattcatcg 1020 
atcaggacat agcgttggct acccgtgata 1080 
accgcttcct cgtgctttac ggtatcgccg 1140 
gccttcttga cgagttctte tgagtttaaa 1200 
caattccgcc cctetccctc ccccccccct 1260 
ggccggtgtg cgtttgtcta tatgttattt 1320 
agggcccgga aacctggccc tgtcttcttg 1380 
gccaaaggaa tgcaaggtct gttgaatgtc 14 40 
tgaagacaaa caacgtctgt agcgaccctt 1500 
aggtgcctct gcggccaaaa gccacgtgta 1560 
cagtgccacg ttgtgagttg gatagttgtg 1620 
ttcaacaagg ggctgaagga tgcccagaag 1680 
cctcggtgca catgctttac atgtgtttag 1740 
accacgggga cgtggttttc ctttgaaaaa 1800 
tactcccaac agacgcgagg cctacttggc 1860 
aggaaccagg tcgaggggga ggtccaagtg 1920 
acctgcgtca atggcgtgtg ttggactgtc 1980 
ggcccaaagg gcccaatcac ccaaatgtac 2040 
caagcgcccc ccggggcgcg ttcettgaea 2100 
ttggtcacga ggcatgccga tgtcattccg 2160 
ctactctccc ccaggcccgt ctcctacttg 2220 
ccctcggggc atgctgtggg catctttcgg 2280 
gcggtggact ttgtacccgt cgagtctatg 2340 
gacaactcgt cccctccggc cgtaccgcag 24 00 
actggtagcg gcaagagcac taaggtgccg 2460 
cttgtcctga acccgtccgt cgccgccacc 2520 
catggtatcg accctaacat cagaaccggg 2580 
acgtactcca cctatggcaa gtttcttgcc 2640 
ateataatat gtgatgagtg ccactcaact 2700 
gtcctggacc aagcggagac ggctggagcg 2760 
ccgggatcgg tcaccgtgcc acatccaaac 2820 
gaaatcccct tttatggcaa agccatcccc 2680 
attttctgcc . attccaagaa gaaatgtgat 2940 
ctcaatgctg tagcatatta ccggggcctt 3000 
gtcatv.gtcg tagcaacgga cgctctaatg 3060 
atcgactgca atacatgtgt cacccagaca 3120 
attgagacga cgaccgtgcc acaagacgcg 3160 
ggtaggggca ggatgggcat ttacaggttt 3240 
ttcgattcct cggttctgtg cgagtgctat 3300 
cccgccgaga Cctcagttag gttgcgggct 3360 
caggaccatc tggagttctg ggagagcgtc 3420 
ttcttgtccc agactaggca ggcaggagac 3480 
acggtgtgcg ccagggctca ggctccacct 3540 
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ccatcgtggg accaaatgtg ggagtgtctc atacggctaa agcctacgct geacgggcca 3600 
acgcccctgc tgtataggct gggagccgtt caaaacgagg ttaetaccac acaccccata 3660 
accaaataca tcatggcatg catgtcggct gacctggagg tcgtcacgag cacctgggtg 3720 
ctggtaggcg gagtcctagc agctctggcc gcgtattgcc tgacaacagg cagcgtggtc 3760 
attgtgggca ggatcatctt gtccggaaag ccggccatca ttcccgacag ggaagtcctt 3840 
taccgggagt tcgatgagat ggaagagtgc gcctcacacc tcccttacat cgaacaggga 3900 
atgcagctcg ccgaacaatt caaacagaag gcaatcgggt tgctgcaaac agccaccaag 3960 
caagcggagg ctgctgctcc cgtggtggaa tccaagtggc ggaccctcga agccttctgg 4020 
gcgaagcata tgtggaattt catcagcggg atacaatatt tagcaggctt gtccactctg 4080 
cctggcaacc ccgcgatagc atcactgatg gcattcacag cctctatcac cagcccgctc 4140 
accacccaac ataccctcct gtttaacatc ctggggggat gggtggccgc ccaacttgct 4200 
cctcccagcg ctgcttctgc tttcgtaggc gccggcatcg ctggagcggc tgttggcagc 4260 
ataggccttg ggaaggtgct tgtggatatt ttggcaggtt atggagcagg ggtggcaggc 4320 
gcgctcgtgg cctttaaggt catgagcggc gagatgccct ccaccgagga cctggttaac 4380 
ctactccctg ctatcctctc ccctggcgcc ctagtcgtcg gggtcgtgtg cgcagcgata 4440 
ctgcgtcggc acgtgggccc aggggagggg gctgtgcagt ggatgaaccg gctgatagcg 4500 
ttcgcttcgc ggggtaacca cgtctccccc acgcactatg tgtctgagag cgacgctgca 4 560 
gcacgtgtca ctcagatcct ctctagtctt accatcactc agctgctgaa gaggcttcac 4620 
cagtggatca acgaggactg ctccacgcca tgctccggct cgtggctaag agatgtttgg 4 680 
gattggatat gcacggtgtt gactgatttc aagacctggc tccagtccaa gctcctgccg 4 740 
cgattgccgg gagtcccctt cttctcatgt caacgtgggt acaagggagt ctggcggggc 4800 
gacggcatca tgcaaaccac ctgcccatgt ggagcacaga tcaccggaca tgtgaaaaoc 4 860 
ggttccatga ggatcgtggg gcctaggacc tgtagtaaca cgtggcatgg aacattcccc 4 920 
attaacgcgt acaccacggg cccctgcacg ccctccccgg cgccaaatta ttctagggcg 4980 
ctgtggcggg tggctgctga ggagtacgtg gaggttacgc gggtggggga tttccactac 5040 
gtgacgggca tgaccactga caacgtaaag tgcccgtgtc aggttccggc ccccgaattc 5100 
ttcacagaag tggatggggt gcggttgcac aggtacgctc cagcgtgcaa acccctccta 5160 
cgggaggagg tcacattcct ggtcgggctc aatcaatacc tggttgggtc acagctccca 5220 
tgcgggcccg aaccggacgt agcagtgctc acttccatgc tcaccgaccc ctcccacatt 5280 
acggcggaga cggctaagcg taggctggcc aggggatctc ccccctcctt ggceagctca 5340 
tcagctagcc agctgtctgc gccttccttg aaggcaacat gcactacccg tcatgactcc 5400 
ccggacgctg acctcatcga ggccaacctc ctgtggcggc aggagatggg cgggaacatc 5460 
acccgcgtgg agtcagaaaa taaggtagta attttggact ctttcgagcc gctccaagcg SS20 
gaggaggatg agagggaagt atccgttccg gcggagatcc tgcggaggtc caggaaattc 5580 
cctcgagcga tgcccatatg ggcacgcccg gattacaacc ctccacfcgtt ogagtcctgg 5640 
aaggacccgg actacgtccc tccagtggta cacgggtgtc cattgccgcc tgccaaggcc 5700 
cctccgatac cacctccacg gagggagagg acggttgtcc tgtcagaatc taccgtgtct 5760 
tctgccttgg cggagctcgc cacaaagacc ttcggcagct ccgaatcgtc ggccgtcgac 5820 
agcggcacgg caacggcctc tcctgaccag ccctccgacg acggcgacgc gggatccgac 5880 
gttgagtcgt actcctccat gccccccctt gagggggagc cgggggatcc cgatctcagc 594 0 
gacgggtctt ggtctaccgt aagcgaggag gctagtgagg acgtcgtctg ctgctcgatg 6000 
tcctacacat ggacaggcgc cctgatcacg ccatgcgctg cggaggaaac caagctgccc 6060 
gtcaatgcac tgagcaactc tttgctccgt caccacaact tggtctatgc tacaacatct 6120 
egeagcgcaa gcctgcggca gaagaaggtc acctttgaca gactgcaggt cctggacgac 6180 
cactaccggg acgtgctcaa ggagatgaag gcgaaggcgt ccacagttaa ggctaaactt 6240 
ctatccgtgg aggaagcctg taagctgacg cccccacatt cggccagatc taaatttggc 6300 
tatggggcaa aggacgtccg gaacctatcc agcaaggccg ttaaccacat ccgctccgtg 6360 
tggaaggact tgctggaaga cactgagaca ecaattgaca ccaccatcat ggcaaaaaat 6420 
gaggttttct gcgtccaacc agagaagggg ggccgcaagc cagctcgcct tatcgtattc 6480 
ccagatttgg gggttcgtgt gtgcgagaaa atggcccttt acgatgtggt ctccaccctc 654 0 
cctcaggccg tgatgggctc ttcatacgga ttccaatact ctcctggaca gcgggtcgag 6600 
ttcctggtga atgcctggaa agcgaagaaa tgccctatgg gcttcgcata tgacacccgc 6660 
tgttttgact caacggtcac tgagaatgac atccgtgttg aggagtcaat ctaccaatgt 6720 
tgtgacttgg cccccgaagc cagacaggcc ataaggtcgc tcacagagcg gctttacatc 6760 
gggggccccc tgactaattc taaagggcag aactgcggct atcgccggtg ccgcgcgagc 684 0 
ggtgtactga cgaccagctg cggtaatacc ctcacatgtt atttgaaggc egctgcggcc 6900 
tgtcgagctg cgaagctcca ggactgcacg atgcccgtat gcggagacga ccttgtcgtt 6960 
atctgtgaaa gcgcggggac ccaagaggac gaggcgagcc tacgggcctt cacggaggct 7020 
atgactagat actctgcccc ccctggggac ccgcccaaac cagaatacga cttggagttg 7080 
ataacatcat gctcctccaa tgtgtcagtc gcgcacgatg catctggcaa aagggtgtac 7140 
tatctcaccc gtgaccccac cacccccctt gcgcgggctg cgtgggagac agctagacac 7200 
actccagtca attcctggct aggcaacatc atcatgtatg cgcccacctt gtgggcaagg 7260 
atgatcctga tgacteattt cttctccatc cttctagctc aggaacaact tgaaaaagcc 7320 
ctagattgtc agatctacgg ggcctgttac tccattgagc cacttgacct acctcagatc 7380 
attcaacgac tccatggcct tagcgcattt tcactccata gttactctcc aggtgagatc 7440 
aatagggtgg cttcatgcct caggaaactt ggggtaccgc ccttgcgagt ctggagacat 7500 
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cgggccagaa gtgtccgcgc taggctactg 
aagtacctct tcaactgggc agtaaggacc 
tcccagttgg atttatccag ctggttcgtt 
agcctgtctc gtgcccgacc ccgctggttc 
gtaggcatct atctactccc caaccgatga 
ccatcctgtt tttttccctt tttttttttc 
ttttctcctt tttttttcct ctttttttcc 
cctagtcacg gctagctgtg aaaggtccgt 
tggcctctct gcagatcaag t 



tcccaggggg ggagggctgc cacttgtggc 7560 
aagctcaaac tcactccaat cccggctgcg 7 620 
gctggttaca gcgggggaga catatatcac 7680 
atgtggtgcc tactcctact ttctgtaggg 7740 
acggggagct aaacactcca ggccaatagg 7800 
tttttttttt tttttttttt tttttttttt 7860 
ttttctttcc tttggtggct ccatcttagc 7920 
gagccgcttg actgcagaga gtgctgatac 7980 

8001 
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<210> 7 
<211> 11076 
<212> DNA 

<213> Hepatitis C Virus 
<400> 7 

gccagecccc gattgggggc gacactccac 
tcttcacgca gaaagcgtct agccatggcg 
cccccctccc gggagagcce tagtggtctg 
gacgaccggg tcctttcttg gatcaacccg 
gegagactge tagccgagta gtgttgggtc 
gtgcttgcga gtgccccggg aggtctcgta 
ctcaaagaaa aaccaaacgt aacaccaacg 
acgcaggttc tccggccgct tgggtggaga 
caatcggctg ctctgatgcc gccgtgttcc 
ttgtcaagac cgacctgtcc -ggtgccctga 
cgtggctggc cacgacgggc gttccttgcg 
gaagggactg gctgctattg ggcgaagtgc 
ctcctgccga gaaagtatcc atcatggctg 
cggctacctg cccattcgac caccaagcga 
tggaagccgg tcttgtcgat caggatgatc 
ccgaactgtt cgccaggctc aaggcgcgca 
atggcgatgc ctgcttgccg aatatcafcgg 
actgtggccg gctgggtgtg gcggaccgct 
ttgctgaaga gcttggcggc gaatgggctg 
ctcccgattc gcagcgcatc gccttctatc 
cagaccacaa cggtttccct ctagcgggat 
aacgttactg gccgaagceg cttggaataa 
tccaccatat tgccgtcttt tggcaafcgtg 
acgagcattc ctaggggtct ttcccctctc 
gtgaaggaag cagttcctct ggaagcttct 
tgcaggcagc ggaacccccc acctggcgac 
taagatacac ctgcaaaggc ggcacaaccc 
gaaagagtca aatggctctc ctcaagcgta 
gtaccccatt gtatgggatc tgatctgggg 
tcgaggttaa aaaacgtcta ggccccccga 
cacgataata ccatgggcac gaatcctaaa 
cgccgcccac aggacgtcaa gttcccgggc 
ttgccgcgca ggggccccag gttgggtgtg 
caacctcgtg gaaggcgaca acctatcccc 
gctcagcccg ggtacccctg gcccctctat 
ctcctgtcac cccgtggctc tcggcctagt 
cgcaatttgg gtaaggtcat cgataccctc 
attccgctcg tcggcgcccc cctagggggc 
gttctggagg acggcgtgaa ctatgcaaca 
ttccttttgg ctttgctgtc ctgtttgacc 
gtatccggag tgtaccatgt cacgaacgac 
gcggacatga tcatgcatac ccccgggtgc 
cgctgctggg tagcgctcac tcccacgctc 
acgatacgac gccatgtcga tttgctcgtt 
gtgggagatc tctgcggatc tgttttcctc 
cggcacgaga cagtacagga ctgcaattgc 
cgtatggctt gggatatgat gatgaactgg 
ttactccgga tcccacaagc tgtegtggat 
gcgggccttg cctactattc catggtgggg 
ctctttgccg gcgttgacgg gggaaectat 
ctcgggatta cgtccctctt ttcacccggg 
aacggcagct ggcacatcaa caggactgcc 
ttccttgctg cgctgttcta cgtgcacaag 
gccagctgca gccccatcga cgcgttcgct 
tcacacagct cggaccagag gccttattgt 
gtacccgcgg cgcaggtgtg tggtccagtg 
gggacgaccg accggttcgg cgtccctacg 
ctgcttctta acaacacgcg gccgccgcaa 
agcaccgggt tcaccaagac gtgcgggggc 



catagatcac tcccctgtga ggaactactg 60 
ttagtatgag tgtcgtgcag cctccaggac 120 
cggaaccggt gagtacaccg gaattgccag 180 
ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgaaaggcc ttgtggtact gcctgatagg 300 
gaccgtgcac catgagcacg aatcctaaac 360 
ggcgcgccat gattgaacaa gatggattgc 420 
ggctattcgg ctatgactgg gcacaacaga 480 
ggctgtcagc gcaggggcgc ccggttcttt 540 
atgaactgca ggacgaggca gcgcggctat 600 
cagctgtgct cgacgttgtc actgaagcgg 660 
cggggcagga tctcctgtca tctcaccttg 720 
atgcaatgcg gcggctgcat acgcttgatc 780 
aacatcgcat cgagcgagca cgtactcgga 840 
tggacgaaga gcatcagggg ctcgcgccag 900 
tgcccgacgg cgaggatctc gtcgtgaccc 960 
tggaaaatgg ccgcttttct ggattcatcg 1020 
atcaggacat agcgttggct acccgtgata 1080 
accgcttcct cgtgctttac ggtatcgccg 1140 
gccttcttga cgagttcttc tgagtttaaa 1200 
caattccgcc cctctccctc ccccccccct 1260 
ggccggtgtg cgtttgtcta tatgttattt 1320 
agggcccgga aa cctggcec tgtcttcttg 1380 
gccaaaggaa tgcaaggrtct gttgaatgtc 1440 
tgaagacaaa caacgtctgt agcgaccctt 1500 
aggtgcctct gcggccaaaa gccacgtgta 1560 
cagtgccacg ttgtgagttg gatagttgtg 1620 
ttcaacoagg ggctgaagga tgcccagaag 1680 
cctcggtgca catgctttac atgtgtttag 1740 
accacgggga cgtggttttc ctttgaaaaa 1800 
cctcaaagaa aaaccaaacg taacaccaac 1860 
ggtggtcaga tcgtcggtgg agtttacctg 1920 
cgcgcgacta ggaagacttc cgagcggtcg 1980 
aaggctcgcc agcccgaggg tagggcctgg 2040 
ggcaatgagg gcttggggtg ggcaggatgg 2100 
tggggcccca cggacccccg gcgtaggtcg 2160 
acgtgcggct tcgccgatct catggggtac 2220 
gctgccaggg ccctggcgca tggcgtccgg 2280 
gggaatctgc ccggttgctc cttttctatc 2340 
atcccagctt ccgcttatga agtgcgcaac 2400 
tgctccaacg caagcattgt gtatgaggca 2460 
gtgccctgcg ttcgggagaa caactcctcc 2520 
gcggccagga acgctagcgt ccccactacg 2580 
ggggcggctg ctctctgctc cgctatgtac 2640 
gtcgcccagc tgtccacctt ctcgcctcgc 2700 
tcaatatatc ccggccacgt gacaggtcae 2760 
tcacctacag cagccctagt ggtatcgcag 2820 
atggtggcgg gggcccattg gggagtccta 2880 
aactgggcta aggCtctgat tgtgatgcta 2940 
gtgacagggg ggacgatggc caaaaacacc 3000 
tcatcccaga aaatccagct tgtaaacacc 3060 
ctgaactgca atgactccct caacactggg 3120 
ttcaactcat ctggatgccc agagcgcatg 3180 
caggggtggg ggcccatcac ttacaatgag 3240 
tggcactacg caccccggcc gtgcggtatc 3300 
tactgcttca ccccaagccc tgtcgtggtg 3360 
tacagttggg gggagaatga gacggacgtg 3420 
ggcaactggt ttggctgtac atggatgaat 3480 
cccccgtgta acatcggggg gatcggcaat 3540 
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aaaaccttga cctgccccac ggactgcttc 
tgtggttcgg ggccttggtt gacacccaga 
cactacccct gcactgtcaa ccttaccatc 
gagcacaggc tcgaagccgc atgcaattgg 
agggacagat cagagcttag cccgctgctg 
tgttccttca ccaccctacc ggctctgtcc 
gtggacgtac aatacctgta cggtotaggg 
gagtatgtcc tgttgctctt ccttcttctg 
atgatgctgc tgatagctca agctgaggcc 
gcatccgtgg ccggggcgca tggcattctc 
tacatcaagg gcaggctggt ccctggggcg 
ctcctgctcc tgctggcgtt accaccacga 
tcgtgcggag gcgcggtttt cgtaggtctg 
ctgttcctcg ctaggctcat atggtggtta 
ttgcaagtgt ggatcccccc cctcaacgtt 
acgtgcgcga tccacccaga gctaatcttt 
ggtccactca tggtgctcca ggctggtata 
gggctcattc gtgcatgcat gctggtgcgg 
gctctcatga agttggccgc actgacaggt 
cgggactggg cccacgcggg cctacgagac 
tctgatatgg agaccaaggt tatcacctgg 
atcttgggcc tgcccgtctc cgcccgcagg 
agccttgaag ggcaggggtg gcgactcctc 
cgaggcctac ttggctgcat catcactagc 
ggggaggtcc aagtggtctc caccgcaaca 
gtgtgttgga ctgtctatca tggtgccggc 
atcacccaaa tgtacaccaa tgtggaccag 
gcgcgttcct tgacaccatg cacctgcggc 
gccgatgtca ttccggtgcg ccggcggggc 
cccgtctcct acttgaaggg efccttegggc 
gtgggcatct ttcgggctgc cgtgtgcacc 
cccgtcgagt ctatggaaac cactatgcgg 
ccggccgtac cgcagacatt ccaggtggcc 
agcactaagg tgccggctgc gtatgcagcc 
tccgtcgccg ccaccctagg tttcggggcg 
aacatcagaa ccggggtagg gaccatcacc 
ggcaagtttc ttgccgacgg tggttgctct 
gagtgccact caactgactc gaccactatc 
gagacggctg gagcgcgact cgtcgtgctc 
gtgccacatc caaacatcga ggaggtggct 
ggcaaagcca tccccatcgc gaccatcaag 
aagaagaaat gtgatgagct cgccgcgaag 
tattaccggg gccttgatgt atccgtcata 
acggacgctc taatgacggg ctttaccggc 
tgtgtcaccc agacagtega cttcagcctg 
gtgccacaag acgcggtgtc acgctcgcag 
ggcatttaca ggtttgtgac tccaggagaa 
ctgtgcgagt gctatgacgc gggctgtgct 
gttaggttgc gggcttacct aaacacacca 
ttctgggaga gcgtctttac aggcctcacc 
aggcaggcag gagacaactt cccctacctg 
gctcaggctc cacctccatc gtgggaccaa 
acgctgcacg ggccaacgcc cctgctgtat 
accacacacc ccataaccaa atacatcatg 
acgagcacct gggtgctggt aggcggagtc 
acaggcagcg tggtcattgt gggcaggatc 
gacagggaag tcctttaccg ggagttcgat 
tacatcgaac agggaatgea gctegccgaa 
caaacagcca ccaagcaagc ggaggctgct 
ctcgaagcct tctgggcgaa gcatatgtgg 
ggcttgtcca ctctgcctgg caaccccgcg 
atcaccagcc cgctcaccac ccaacatacc 
gccgcccaac ttgctcctcc cagcgctgct 
gcggctgttg gcagcatagg ccttgggaag 
gcaggggtgg caggcgcgct cgtggccttt 
gaggacctgg ttaacctact ccctgctatc 



cggaagcacc ccgaggccac ttacaccaag 3600 
tgcttggtcc actacccata caggctttgg 3660 
ttcaaggtta ggatgtacgt ggggggagtg 3720 
actcgaggag agcgttgtaa cctggaggac 3780 
ctgtctacaa cggagtggca ggtattgccc 3840 
actggtttga tccatctcca tcagaacgtc 3900 
tcggcggttg tctcctttgc aatcaaatgg 3960 
gcggacgcgc gcgtctgtgc ctgcttgtgg 4020 
gccctagaga acctggtggt cctcaacgcg 4080 
tccttcctcg tgttcttctg tgctgcctgg 4140 
gcatatgccc tctacggcgt atggccgcta 4200 
gcatacgcca tggaccggga gatggcagca 4260 
atactcttga ccttgtcacc gcactataag 4320 
caatatttta tcaccagggc cgaggcacac 4380 
cgggggggcc gcgatgccgt catcctcctc 4440 
accatcacca aaatcttgct cgccatactc 4500 
accaaagtgc cgtaettcgt gcgcgcacac 4560 
aaggttgctg ggggtcatta tgtccaaatg 4620 
acgtacgttt atgaccatct caccccactg 4 680 
cttgeggtgg cagttgagcc cgtcgtcttc 4 74 0 
ggggcagaca ccgcggcgtg tggggacatc 4800 
gggagggaga tacatetggg accggcagac 4860 
gcgcctatta cggcctactc ccaacagacg 4920 
ctcacaggcc gggacaggaa ccaggtegag 4980 
caatctttcc tggcgacctg cgtcaatggc 504 0 
tcaaagaccc ttgccggccc aaagggccca 5100 
gacctcgtcg gctggcaagc gccccccggg 5160 
agctcggacc tttacttggt cacgaggcat 5220 
gacagcaggg ggagcctact ctcccccagg 5280 
ggtccactgc tctgeccetc ggggcatgct 534 0 
cgaggggttg cgaaggcggt ggactttgta 54 00 
tccccggtct tcacggaeaa ctcgtcccct 5460 
catctacacg cccctactgg tagcggcaag 5520 
caagggtata aggtgcttgt cctgaacccg 5580 
tatatgtcta aggcacatgg tatcgaccct 564 0 
acgggtgccc ccatcacgta ctccacctat 5700 
99999C9CCt atgacatcat aatatgtgat 5760 
ctgggcatcg gcacagtcct ggaccaagcg 5820 
gccaccgcta cgcctccggg atcggtcacc 5880 
ctgtccagca ctggagaaat ceecttttat 594 0 
999999aggc acctcatttt ctgccattcc 6000 
ctatccggcc tcggactcaa tgctgtagca 6060 
ccaactagcg gagacgtcat tgtcgtagca 6120 
gatttcgact cagtgatcga ctgcaataca 6180 
gacccgacct tcaccattga gacgacgacc 624 0 
cggcgaggca ggactggtag gggcaggatg 6300 
cggccctcgg gcatgttcga ttcctcggtt 6360 
tggtacgagc tcacgcccgc cgagacctca 6420 
gggctgcccg tctgccagga ccatctggag 6480 
cacatagacg cccatttctt gtcccagact 6540 
gtagcatacc aggctacggt gtgcgccagg 6600 
atgtgggagt gtctcatacg gctaeagcct 6660 
aggctgggag ccgttcaaaa cgaggttact 6720 
gcatgcatgt cggctgacct ggaggtcgtc 6780 
ctagcagctc tggccgcgta ttgcctgaca 6840 
atcttgtccg gaaagccggc catcattccc 6900 
gagatggaag agtgcgcctc acacctccct 6960 
caattcaaac agaaggcaat cgggttgctg 7020 
gctcccgtgg tggaatccaa gtggcggacc 708 0 
aatttcatca gcgggataca atatttagca 714 0 
atagcatcac tgatggcatt cacagcctct 7200 
ctcctgttta acatcctggg gggatgggtg 7260 
tctgctttcg taggcgccgg catcgctgga 7320 
gtgcttgtgg atattttggc aggttatgga 7380 
aaggtcatga gcggcgagat gccctccacc 744 0 
ctctcccctg gcgccctagt cgtcggggtc 7500 



48 



EP 1 043 399 A2 



10 



15 



20 



25 



30 



35 



AO 



45 



50 



gtgtgcgcag 
aaccggctga 
gagagcgacg 
ctgaagaggc 
ctaagagatg 
tccaagctcc 
ggagtctggc 
ggacatgtga 
catggaacat 
aattattcta 
ggggatttcc 
ccggcccccg 
tgcaaacccc 
gggtcacagc 
gacccctccc 
tccttggcca 
acccgtcatg 
atgggcggga 
gagccgctcc 
aggtccagga 
ctgttagagt 
ccgcctgcca 
gaatctaccg 
tcgtcggccg 
gacgcgggat 
gatcccgatc 
gtctgctgct 
gaaaccaagc 
tatgctacaa 
caggtcctgg 
gttaaggcta 
agatctaaat 
cacatccgct 
atcatggcaa 
cgccttatcg 
gtggtctcca 
ggacagcggg 
gcatatgaca 
tcaatctacc 
gagcggcttt 
cggtgccgcg 
aaggccgctg 
gacgaccttg 
gccttcacgg 
tacgacttgg 
ggcaaaaggg 
gagacagcta 
accttgtggg 
caacttgaaa 
gacctacctc 
tctccaggtg 
cgagtctgga 
gctgccactt 
ccaatcccgg 
ggagacatat 
ctactttctg 
ctccaggcca 
tttttttttt 
tggctccatc 
agagagtgct 



cgatactgcg 
tagcgttcgc 
ctgcagcacg 
ttcaccagtg 
tttgggattg 
tgccgcgatt 
ggggcgacgg 
aaaacggttc 
tccccattaa 
gggcgctgtg 
actacgtgac 
aattcttcac 
tcctacggga 
tcccatgcgg 
acattacggc 
gctcatcagc 
actccccgga 
acatcacccg 
aagcggagga 
aattccctcg 
cctggaagga 
aggcccctcc 
tgtcttctgc 
tcgacagcgg 
ccgacgttga 
tcagcgacgg 
cgatgtccta 
tgcccgtcaa 
catctcgcag 
acgaccacta 
aacttctatc 
ttggctatgg 
ccgtgtggaa 
aaaatgaggt 
tattcccaga 
ccctccctca 
tcgagttcct 
cccgctgttt 
aatgttgtga 
acatcggggg 
cgagcggtgt 
cggcctgtcg 
tcgttatctg 
aggctatgac 
agttgataac 
tgtactatct 
gacacactcc 
caaggatgat 
aagccctaga 
agatcattca 
agatcaatag 
gacatcgggc 
gtggcaagta 
ctgcgtccca 
atcacagcct 
taggggtagg 
ataggccatc 
tttttttttc 
ttagccctag 
gatactggcc 



tcggcacgtg 
ttcgcggggt 
tgtcactcag 
gatcaacgag 
gatatgcacg 
gccgggagtc 
catcatgcaa 
catgaggatc 
cgcgtacacc 
gcgggtggct 
gggcatgacc 
agaagtggat 
ggaggtcaca 
gcccgaaccg 
ggagacggct 
tagccagctg 
cgctgacctc 
cgtggagtca 
ggatgagagg 
agcgatgccc 
cccggactac 
gataccacct 
cttggcggag 
cacggcaacg 
gtcgtactcc 
gtcttggtct 
cacatggaca 
tgcactgagc 
cgcaagcctg 
ccgggacgtg 
cgtggaggaa 
ggcaaaggac 
ggacttgctg 
tttctgcgtc 
tttgggggtt 
ggccgtgatg 
ggtgaatgcc 
tgactcaacg 
cttggccccc 
ccccctgact 
actgacgacc 
agctgcgaag 
tgaaagcgcg 
tagatactct 
atcatgctcc 
cacccgtgac 
agtcaattcc 
cctgatgact 
ttgtcagatc 
acgactccat 
ggtggcttca 
cagaagtgtc 
cctcttcaac 
gttggattta 
gtctcgtgcc 
catctatcta 
ctgttttttt 
tccttttttt 
tcacggctag 
tctctgcaga 



ggcccagggg 
aaccacgtct 
atcctctcta 
gactgctcca 
gtgttgactg 
cccttcttct 
accacctgcc 
gtggggccta 
acgggcccct 
gctgaggagt 
actgacaacg 
ggggtgcggt 

ttcctggtcg 
gacgtagcag 
aagcgtaggc 
tctgcgcctt 
atcgaggcca 
gaaaataagg 
gaagtatccg 
atatgggcac 
gtccctccag 
ccacggaggg 
ctcgccacaa 
gcctctcctg 
tccatgcccc 
accgtaagcg 
ggcgccctga 
aactctttgc 
cggcagaaga 
ctcaaggaga 
gcctgtaagc 
gtccggaacc 
gaagacactg 
caaccagaga 
cgtgtgtgcg 
ggctcttcat 
tggaaagcga 
gtcactgaga 
gaagccagac 
aattctaaag 
agctgcggta 
ctccaggact 
gggacccaag 
gccccccctg 
tccaatgtgt 
cccaccaccc 
tggctaggca 
catttcttct 
tacggggcct 
ggccttagcg 
tgcctcagga 
cgcgctaggc 
tgggcagtaa 
tccagctggt 
cgaccccgct 
ctccccaacc 
cccttttttt 
ttcctctttt 
ctgtgaaagg 
tcaagt 



agggggctgt 

cccccacgca 
gtcttaccat 
cgccatgctc 
atttcaagac 
catgtcaacg 
catgtggagc 
ggacctgtag 
gcacgccctc 
acgtggaggt 
taaagtgccc 
tgcacaggta 
ggctcaatca 
tgctcacttc 
tggccagggg 
ccttgaaggc 
acctcctgtg 
tagtaatttt 
ttccggcgga 
gcccggatta 
tggtacacgg 
agaggacggt 
agaccttcgg 
accagccctc 
cccttgaggg 
aggaggctag 
tcacgccatg 
tccgtcacca 
aggtcacctt 
tgaaggcgaa 
tgacgccccc 
tatccagcaa 
agacaccaat 
aggggggccg 
agaaaatggc 
acggattcca 
agaaatgccc 
atgacatccg 
aggccataag 
ggcagaactg 
ataccctcac 
gcacgatgct 
aggacgaggc 
gggacccgcc 
cagtcgcgca 
cccttgcgcg 
acatcatcat 
ccatccCtct 
gttactccat 
cattttcact 
aacttggggt 
tactgtccca 
ggaccaagct 
tcgttgctgg 
ggttcatgtg 
gatgaacggg 
ttttcttttt 
tttccttttc 
tccgtgagcc 



gcagtggatg 
ctatgtgtct 
cactcagctg 
cggctcgtgg 
ctggctccag 
tgggtacaag 
acagatcacc 
taacacgtgg 
cccggcgcca 
tacgcgggtg 
gtgtcaggtt 
cgctccagcg 
atacctggtt 
catgctcacc 
atctcccccc 
aacatgcact 
gcggcaggag 
ggactctttc 
gatcctgcgg 
caaccctcca 
gtgtccattg 
tgtcctgtca 
cagctccgaa 
cgacgacggc 
ggagccgggg 
tgaggacgtc 
cgctgcggag 
caacttggtc 
tgacagactg 
ggcgtccaca 
acattcggcc 
ggccgttaac 
tgacaccacc 
caagccagct 
cctttacgat 
atactctcct 
tatgggcttc 
tgttgaggag 
gtcgctcaca 
cggctatcgc 
atgttafcttg 
cgtatgcgga 
gagcctacgg 
caaaccagaa 
cgatgcatct 
ggctgcgtgg 
gtatgcgccc 
agctcaggaa 
tgagccactt 
ccatagttac 
accgcccttg 

gggggggagg 

caaactcact 
ttacagcggg 
gtgcctactc 
gagctaaaca 
tttttttttt 
tttcctttgg 
gcttgactgc 



7560 

7620 

7680 

7740 

7800 

7860 

7920 

7980 

8040 

8100 

8160 

8220 

8280 

6340 

84O0 

8460 

8520 

8580 

8640 

8700 

8760 

8820 

8880 

8940 

9000 

9060 

9120 

9180 

9240 

9300 

9360 

9420 

9480 

9540 

9600 

9660 

9720 

9780 

9840 

9900 

9960 

10020 

10O80 

10140 

10200 

10260 

10320 

10380 

10440 

10500 

10560 

10620 

10660 

10740 

10800 

10860 

10920 

10980 

11040 

11076 
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<210> 8 
<211> 8001 
<2l2> DNA 

<213> Hepatitis C Virus 
<4O0> 8 

gccagccccc gattgggggc gacactccac 
tcttcacgca gaaagcgtct agccatggcg 
cccccctccc gggagagcca tagtggtctg 
gacgaccggg tcctttcttg gatcaacccg 
gcgagactgc tagccgagta gtgttgggtc 
gtgcttgcga gtgccccggg aggtctcgta 
ctcaaagaaa aaccaaacgt aacaccaacg 
acgcaggttc tccggccgct tgggtggaga 
caatcggctg ctctgatgcc gccgtgttcc 
ttgtcaagac cgacctgtcc ggtgccctga 
cgtggctggc cacgacgggc gttccttgcg 
gaagggactg gctgctattg ggcgaagtgc 
ctcctgccga gaaagtatcc atcatggctg 
cggctacctg cccattcgac caccaagcga 
tggaageegg tcttgtcgat caggatgatc 
ccgaactgtt cgccaggctc aaggcgcgca 
atggcgatgc ctgcttgccg aatatcatgg 
actgtggccg gctgggtgtg gcggaccgct 
ttgctgaaga gcttggcggc gaatgggctg 
ctcccgattc gcagcgcatc gccttctatc 
cagaccacaa cggtttccct ctagcgggat 
aacgttactg gccgaagccg cttggaataa 
tccaccatat tgccgtcttt tggcaatgtg 
acgagcattc ctaggggtct ttcccctctc 
gtgaaggaag cagttcctct ggaagcttct 
tgcaggcagc ggaacccccc acctggcgac 
taagatacac ctgcaaaggc ggcacaaccc 
gaaagagtca aatggctctc ctcaagcgta 
gtaccccatt gtatgggatc tgatctgggg 
tcgaggttaa aaaacgtcta ggccccccga 
cacgataata ccatggcgcc tattacggcc 
tgcatcatca ctagcctcac aggccgggac 
gtctccaccg caacacaatc tttcctggcg 
tatcatggtg ccggctcaaa gacccttgcc 
accaatgtgg accaggacct cgtcggctgg 
ccatgcacct gcggcagctc ggacctttac 
gtgcgccggc ggggcgacag cagggggagc 
aagggctctt cgggcggtcc actgctctgc 
gctgccgtgt gcacccgagg ggttgcgaag 
gaaaccacta tgcggtcccc ggtcttcacg 
acattccagg tggcccatct acacgcccct 
gctgcgtatg cagcccaagg gtataaggtg 
ctaggtttcg gggcgtatat gtctaaggca 
gtaaggacca tcaccacggg tgcccccatc 
gacggtggtt gctctggggg cgcctatgac 
gactcgacca ctatcctggg catcggcaca 
cgactcgtcg tgctcgccac cgctacgcct 
atcgaggagg tggctctgtc cagcactgga 
atcgagacca tcaagggggg gaggcacctc 
gagctcgccg cgaagctgtc cggcctcgga 
gatgtatccg tcataccaac r.agcggagac 
acgggcttta ccggtgactt cgactcagtg 
gtcgacttca gcctggaccc gaccttcacc 
gtgtcacgct cgcagcggcg aggcaggact 
gtgactccag gagaacggcc ctcgggcatg 
gacgcgggct gtgcttggta egagctcacg 
tacctaaaca caccagggtt gcccgtctgc 
tttacaggcc tcacccacat agacgcccat 
aacttcccct acctggtagc ataccaggct 



catagatcac tcccctgtga ggaactactg 60 
ttagtatgag tgtcgtgcag cctccaggac 120 
cggaaccggt gagtacaccg gaattgccag 180 
ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgaaaggcc ttgtggtact gcctgatagg 300 
gaccgtgcac catgagcacg aatcctaaac 360 
ggcgcgccat gattgaacaa gatggattgc 420 
ggctattcgg ctatgactgg gcacaacaga 4 80 
ggctgtcagc gcaggggcgc ccggttcttt 540 
atgaactgca ggacgaggca gcgcggctat 600 
cagctgtgct cgacgttgtc actgaagcgg 660 
cggggcagga tctcctgtca tctcaccttg 720 
atgcaatgcg gcggctgcat acgcttgatc 7 80 
aacatcgcat cgagcgagca cgtactcgga 840 
tggacgaaga gcatcagggg ctcgcgccag 900 
tgcccgacgg cgaggatctc gtcgtgaccc 960 
tggaaaatgg ccgcttttct ggattcatcg 1020 
atcaggacat agcgttggct acccgtgata 1080 
accgcttcct cgtgctttac ggtatcgccg 1140 
gccttcttga cgagttcttc tgagtttaaa 1200 
caattccgcc cctctccctc ccccccccct 1260 
ggccggtgtg cgtttgtcta tatgttattt 1320 
agggcccgga aacctggccc tgtcttcttg 1380 
gceaaaggaa tgcaaggtct gttgaatgtc 1440 
tgaagacaaa caacgtctgt agcgaccctt 1500 
aggtgcctcc gcggccaaaa gccacgtgta 1560 
cagtgccacg ttgtgagttg gatagttgtg 1620 
ttcaacaagg ggctgaagga tgcccagaag 1680 
cctcggtgca catgetttac atgtgtttag 1740 
accacgggga cgtggttttc ctttgaaaaa 1800 
tactcccaac agacgcgagg cctacttggc i860 
aggaaccagg tcgaggggga ggtccaagtg 1920 
acctgcgtca atggcgtgtg ttggactgtc 1980 
ggcccaaagg gcccaatcac ccaaatgtac 2040 
caagcgeccc ccggggcgcg ttccttgaca 2100 
ttggtcacga ggcatgccga tgtcattccg 2160 
ctactctccc ccaggcccgt ctcctacttg 2220 
ccctcggggc acgctgtggg catctttcgg 2280 
gcggtggact ttgtacccgt egagtetatg 2340 
gacaactcgt cccctccggc cgtaccgcag 2400 
actggtagcg gcaagagcac taaggtgccg 2460 
cttgtcctga acccgtccgt cgccgccacc 2520 
catggtatcg accctaacat cagaatcggg 2580 
acgtactcca cctatggcaa gtttcttgcc 2640 
atcataatat gtgatgagtg ccactcaact 2700 
gtcctggacc aagcggagac ggctggagcg 2760 
ccgggatcgg tcaccgtgcc acatccaaac 2820 
gaaatcccct tttatggcaa agccatcccc 2880 
attttctgcc attccaagaa gaaatgtgat 2940 
ctcaatgctg tagcatatta ccggggcctt 3000 
gtcattgtcg tagcaacgga cgctctaatg 3060 
atcgactgca atacatgtgt cacccagaca 3120 
attgagacga cgaccgtgcc acaagacgcg 3180 
ggtaggggca ggatgggcat ttacaggttt 3240 
ttcgattcct cggttctgtg cgagtgctat 3300 
cccgccgaga cctcagttag gttgcgggct 3360 
caggaccatc tggagttctg ggagagcgtc 3420 
ttcttgtccc agactaagca ggcaggagac 3480 
acggtgtgcg ccagggctca ggctccacct 3540 
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ccatcgtggg accaaatgtg gaagtgtctc 
acgcccctgc tgtataggct gggagccgtt 
accaaataca tcatggcatg catgtcggct 
ctggtaggcg gagtcctagc agctctggcc 
attgtgggca ggatcatctt gtccggaaag 
taccgggagt tcgatgagat ggaagagtgc 
atgcagctcg ccgaacaatt caaacagaag 
caagcggagg ctgctgctcc cgtggtggaa 
gcgaagcata tgtggaattt catcagcggg 
cctggcaacc ccgcgatagc atcactgatg 
accacccaac ataccctcct gCttaacatc 
cctcccagcg ctgcttctgc tttcgtaggc 
ataggccttg ggaaggtgct tgtggatatt 
gcgctcgtgg cctttaaggt catgagcggc 
ctactccctg ctatcctctc ccctggcgcc 
ctgcgtcggc acgtgggccc aggggagggg 
ttcgcttcgc ggggtaacca cgtctccccc 
gcacgtgtca ctcagatcct ctctagtctt 
cagtggatca acgaggactg ctccacgcca 
gattggatat gcacggtgtt gactgatttc 
cgatcgccgg gagtcccctt cctctcatgt 
gacggcatca tgcaaaccac ctgcccatgt 
ggttccatga ggatcgtggg gcctaggacc 
attaacgcgt aeaccacggg cccctgcacg 
ctgtggcggg tggctgctga ggagtacgtg 
gtgacgggca tgaccactga cgacgtaaag 
ttcacagaag tggatggggt gcggttgcac 
cgggaggagg tcacattcct ggtcgggctc 
tgcgagcccg aaccggatgt agcagtgctc 
acggcggaga cggctaagcg taggctggcc 
tcagctagcc agctgtctgc gccttccttg 
ccggacgctg acctcatcga ggccaacctc 
acccgcgtgg agtcagaaaa taaggtagta 
gaggaggatg agagggaagt atccgttccg 
cctcgagcga tgcccatatg ggcacgcccg 
aaggacccgg actacgtccc tccagtggta 
cctccgatac caccttcacg gaggaagagg 
tcbgccttgg cggagctcgc cacagagacc 
agcggcacgg caacggcctc tcctgaccag 
gttgagtcgt actcctccat gccccccctt 
gacgggtctt ggtctaccgt aagegaggag 
tcctacacat ggacaggcgc cctgatcacg 
atcaatgcac tgagcaactc tttgctccgt 
cgcagcgcaa gcctgcggca gaagaaggtc 
cactaccggg acgtgctcaa ggagatgaag 
ctatccgtgg aggaagcctg taagctgacg 
tatggggcaa aggacgtccg gaacctatcc 
tggaaggact tgctggaaga cactgagaca 
gaggttttct gcgtccaacc agagaagggg 
ccagatttgg gggttcgtgt gtgcgagaaa 
cctcaggccg tgatgggctc ttcatacgga 
ttcctggtga atgcctggaa agcgaagaaa 
tgttttgact caacggtcac tgagaatgac 
tgtgacttgg cccccgaagc cagacaggcc 
gggggccccc tgactaattc taaagggcag 
ggtgtactga cgaccagctg cggtaatacc 
tgtcgagctg cgaagctcca ggactgcacg 
atctgtgaaa gcgcggggac ccaagaggac 
atgactagat actctgcccc ccctggggac 
ataacatcat gctcctccaa tgtntcagtc 
tatctcaccc gtgaccccac cacccccctt 
actccagtca attcctggct aggcaacatc 
atgatcctga tgactcattt cttctccatc 
ctagattgtc agatctacgg ggcctgtcac 
attcaacgac tccatggcct tagcgcattt 
aatagggtgg cttcatgcct caggaaactt 



atacggctaa agcctacgct gcacgggcca 3600 
caaaacgagg ttactaccac acaccccata 3660 
gacctggagg tcgtcacgag cacctgggtg 3720 
gcgtattgcc tgacaacagg cagcgtggtc 3780 
ccggccatca ttcccgacag ggaagtcctt 384 0 
gcctcacacc tcccttacat cgaacaggga 3900 
gcaatcgggt tgctgcaaac agccaccaag 3960 
tccaagtggc ggaccatcga agccttctgg 4020 
atacaatatt tagcaggctt gtccactctg 4 080 
gcattcacag cctctatcac cagcccgctc 4140 
ctggggggat gggtggccgc ccaacttgct 420O 
gccggcatcg ctggagcggc tgttggcagc 4260 
ttggcaggtt atggagcagg ggtggcaggc 4 320 
gagatgccct ccaccgagga cctggttaac 4380 
ctagtcgtcg gggtcgtgtg cgcagcgata 4440 
gctgtgcagt ggatgaaccg gctgatagcg 4500 
acgcactatg tgcctgagag cgacgctgca 4560 
accatcactc agctgctgaa gaggcttcac 4620 
tgctccggct cgtggctaag agatgtttgg 4 680 
aagacctggc tccagtccaa gctcctgccg 4740 
caacgtgggt acaagggagt ctggcggggc 4 800 
ggggcacaga tcaccggaca tgtgaaaaac 4860 
tgtagtaaca cgtggcatgg aacattcccc 4 920 
ccctccccgg cgccaaatta ttctagggcg 4 980 
gaggttacgc gggtggggga tttccactac 5040 
tgcccgtgtc aggttccggc ccccgaattc 5100 
aggtacgctc cagcgtgcaa acccctccta 5160 
aatcaatacc tggttgggtc acagctccca 5220 
acttccatgc tcaccgaccc ctcccacatt 5280 
aggggatctc ctcccccctt ggccagctca 5340 
aaggcaacat gcactacccg tcatgactcc 5400 
ctgtggcggc aggagatggg cgggaacatc 5460 
attttggact ctttcgagcc gctccaagcg 5520 
gcggagatcc tgcggaggtc caggaaattc 5580 
gattacaacc ctccactgtt agagtcetgg 564 0 
cacgggtgtc cattgccgcc tgccaaggcc 5700 
acggttgtcc tgtcagaatc taccgtgtct 5760 
ttcggcagct ccgaatcgtc ggccgtcgac 5820 
ccctccgacg acggcgacgc gggatccgac 5880 
gagggggagc cgggggatcc cgatctcagc 594 0 
getagtgagg acgtcgtctg ctgctcgatg 6000 
ccatgcgctg cggaggaaac caagctgccc 6060 
caccacaact tggtctatgc tacaacatct 6120 
acctttgaca gactgcaggt cctggacgac 6180 
gcgaaggcgt ccacagttaa ggctaaactt 624 0 
cccccacatt cggccagatc taaatttggc 6300 
agcaaggccg ttaaccacat ccgctccgtg 6360 
ccaattgaca ccaccatcat ggcaaaaaat 6420 
ggccgcaagc cagctcgcct tatcgtattc 64 80 
atggcccttt acgatgtggt ctccaccctc 6540 
ttccaatact ctcctggaca gcgggtcgag 6600 
tgccctatgg gcttcgcata tgacacccgc 6660 
atccgtgttg aggagtcaat ctaccaatgt 6720 
ataaggtcgc tcacagagcg gctttacatc 6780 
aactgcggct atcgccggtg ccgcgcgagc 6840 
ctcacatgtt acttgaaggc cgctgcggcc 6900 
atgctcgtat gcggagacga ccttgtcgtt 6960 
gaggcgagcc tacgggcctt eacggaggct 7020 
ccgcccaaac cagaatacga cttggagttg 7080 
gcgcacgatg catctggcaa aagggtgtac 7140 
gcgcgggctg cgtgggagac agctagacac 7200 
atcatgtatg cgcccacctt gtgggcaagg 7260 
cttctagctc aggaacaact tgaaaaagcc 7320 
tccattgagc cacttgacct acctcagatc 7380 
tcactccata gttactctcc aggtgagatc 7440 
ggggtaccgc ccttgcgagt ctggagacat 7500 
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cgggccagaa gtgtccgcgc taggctactg 
aagtacctct tcaactgggc agtaaggacc 
tcccagttgg atttatccag ctggttcgtt 
agcctgtctc gtgcccgacc ccgctggttc 
gtaggcatct atctactccc caaccgatga 
ccatcctgtt tttttccctt tttttttttc 
ttttctcctt tttttttcct ctttttttcc 
cctagtcacg gctagctgtg aaaggtccgt 
tggcctctct gcagatcaag t 



tcccaggggg ggagggctgc cacttgtggc 7560 
aagctcaaac tcactccaat cccggctgcg 7620 
gctggttaca gcgggggaga catatatcac 7680 
atgtggtgcc tactcctact ttctgtaggg 7740 
acggggagct aaacactcca ggccaatagg 7800 
tttttttttt tttttttttt tttttttttt 7860 
ttttctttcc tttggtggct ccatcttagc 7920 
gagccgcttg actgcagaga gtgctgatac 7980 

8001 
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<210> 9 
<2ll> 11076 
<212> DNA 

<213> Hepatitis C Virus 
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<400> 9 

gccagccccc 

tcttcacgca 

cccccctccc 

gacgaccggg 

gcgagoctgc 

gtgcttgcga 

ctcaaagaaa 

acgcaggttc 

caatcggctg 

ttgtcaagac 

cgtggctggc 

gaogggactg 

ctcefcgccga 

cggctacctg 

tggaagccgg 

ccgaactgtt 

atggcgatgc 

actgtggccg 

ttgctgaaga 

ctcccgattc 

cagaccacaa 

aacgttactg 

tccaccatat 

acgagcattc 

gtgaaggaag 

tgcaggcagc 

taagatacac 

gaaagagtca 

gtaccccatt 

tcgaggttaa 

cacgataata 

cgccgcccec 

ttgccgcgca 

caacctcgtg 

gctcagcccg 

ctcctgtcoc 

cgcaatttgg 

attccgctcg 

gttctggagg 

ttccttttgg 

gtatccggag 

gcggacatga 

cgctgctggg 

acgatacgac 

gtgggagatc 

cggcacgaga 

cgtatggctt 

ttactccgga 

gcgggccttg 

ctetttgccg 

ctcgggatta 

aacggcagct 

ttccttgctg 

gccagctgca 

tcacacagct 

gtacccgcgg 

gggacgaccg 

ctgcttctta 

agcactqggt 



gottgggggc 
gaaagcgtct 
gggagagcca 
tcctttcttg 
tagccgogta 
gtgccccggg 
aaccaaacgt 
tccggccgct 
ctctgatgcc 
cgacctgtcc 
cacgacgggc 
gctgctattg 
gaaagtatcc 
cccattcgac 
tcttgtcgat 
cgccaggctc 
ctgcttgccg 
gctgggtgtg 
gcttggcggc 
gcagcgcatc 
cggtttccct 
gccgaagccg 
tgccgtcttt 
ctaggggtct 
cagttcctct 
ggaacccccc 
ctgcaaaggc 
aatggctctc 
gtatgggatc 
aaaacgtcta 
ccatgggcac 
a gg a eg tea a 
ggggccccag 
gaoggegaca 
ggtacccctg 
cccgtggctc 
gtaaggtcat 
tcggcgcccc 
acggcgtgaa 
ctttgctgtc 
tgtaccatgt 
teatgeatae 
tagcgctcac 
gecatgtega 
tetgeggate 
cagtacagga 
gggatatgat 
tcccacaagc 
cctactattc 
gcgttgacgg 
cgtccctctt 
ggcacatcaa 
cgctgttcta 
geeceatcga 
eggaccagag 
cgcaggtgtg 
aceggttegg 
acaacacgcg 
tcaccaagac 



gacactccac 
agccatggcg 
tagtggtctg 
gatcaacccg 
gtgttgggtc 
aggtctegta 
aacaccaacg 
tgggtggaga 
gccgtgttcc 
ggtgccctga 
gttccttgcg 
ggcgaagtgc 
atcatggctg 
caccaagcga 
caggatgatc 
aaggegegea 
aatatcatgg 
gcggaccgct 
gaatgggctg 
gccttctatc 
etagegggat 
cttggaataa 
tggcaatgtg 
ttcccctctc 
ggaagcttct 
acctggcgac 
ggcacaaccc 
etcaagegta 
tgatctgggg 
ggccccccga 
gaatcctaaa 
gttcccgggc 
gttgggtgtg 
occtatcccc 
gcccctctat 
teggectagt 
cgataccctc 
cctagggggc 
etatgeaaca 
ctgtttgacc 
cacgaacgac 
ccccgggtgc 
tcccacgctc 
tttgctcgtt 
tgttttcctc 
etgcaattgc 
getgaactgg 
tgtcgtggat 
catggtgggg 
gggaacctat 
ttcacccggg 
caggactgcc 
cgtgcacaag 
cgcgttcgct 
gecttattgt 
tggtccagtg 
cgtccctacg 
gcegecgeaa 
gtgeggggge 



catagatcac 
ttagtatgag 
eggaaceggt 
ctcaatgcct 
gegaaaggee 
gaccgtgcac 
ggcgcgccat 
ggctattegg 
ggctgtcagc 
atgaactgea 
cagctgtgct 
eggggcagga 
atgcaatgcg 
aacategcat 
tggacgaaga 
tgcccgacgg 
tggaaaatgg 
atcaggacat 
accgcttcct 
gecttcttga 
caattccgcc 
ggccggtgtg 
agggecegga 
gecaaaggaa 
tgaagacaaa 
aggtgectet 
cagtgccacg 
ttcaacaagg 
cctcggtgca 
accaegggga 
cctcaaagaa 
ggtggtcaga 
cgcgcgacta 
aaggctcgcc 
ggcaatgagg 
tggggcccca 
aegtgegget 
getgecaggg 
gggaatctgc 
atcccagctt 
tgctccaacg 
gtgccctgcg 
gcggccagga 
ggggcggctg 
gtcgcccagc 
tcaatatatc 
tcacctacag 
atggtggcgg 
aactgggcta 
gtgacagggg 
tcatcccaga 
ctgaactgea 
ttcaactcat 
eaggggtggg 
tggcactacg 
tactgettea 
tacagttggg 
ggcaactggt 
cccccgtgta 



tcccctgtga 
tgtcgtgcag 
gagtacaccg 
ggagatttgg 
ttgtggtact 
catgagcacg 
gattgaacaa 
ctatgactgg 
geaggggege 
ggacgaggca 
cgacgttgtc 
tctcctgtca 
geggctgeat 
egagegagea 
gcatcagggg 
cgaggatctc 
ccgcttttct 
agcgttggct 
cgtgctttac 
cgagttcttc 
cctctccctc 
cgtttgtcta 
aacctggccc 
tgeaaggtet 
caaegtctgt 
gcggccaaaa 
ttgtgagttg 
ggctgaagga 
catgetttae 

cgtggttttc 

aaaccaaacg 
tcgtcggtgg 
ggaagacttc 
ageccgaggg 
gcttggggtg 
cggacccccg 
tcgccgatct 
ccctggcgca 
ccggttgctc 
ccgcttatga 
caagcattgt 
ttcgggagaa 
aegctagegt 
ctctctgctc 
tgttcacctt 
ccggccacgt 
cagccctagt 
gggcccattg 
aggttctgat 
ggacgatggc 
aaatccagct 
atgactccct 
ctggatgccc 
ggcccatcac 
caccccggcc 
ccccaagccc 
gggagaatga 
ttggetgtac 
acateggggg 



ggaactactg 
cctccaggac 
gaattgccag 
gcgtgccccc 
gectgatagg 
aatcctaaac 
gatggattgc 
gcacaacaga 
ccggttcttt 
gegeggctat 
actgaagegg 
tctcaccttg 
aegcttgate 
cgtactcgga 
ctcgcgccag 
gtcgtgaccc 
ggattcatcg 
accegtgata 
ggtatcgccg 
tgagtttaaa 
ccccccccct 
tatgttattt 
tgtcttcttg 
gttgaatgtc 
agcgaccctt 
gccacgtgta 
gatagttgtg 
tgcccagaag 
atgtgtttag 
ctttgaaaaa 
taacaccaac 
agtttacctg 
egageggteg 
tagggectgg 
ggcaggatgg 
gegtaggteg 
catggggtac 
tggegtcegg 
cttttctatc 
agtgcgcaac 
gtatgaggca 
caactcctcc 
ccccactacg 
cgctatgtac 
ctcgcctcgc 
gacaggtcac 
ggtatcgcag 
gggagtccta 
tgtgatgcta 
caaaaacacc 
tgtaaacacc 
caacactggg 
agagegcatg 
ttacaatgag 
gtgeggtate 
tgtcgtggtg 
gaeggaegtg 
atggatgaat 
gateggcaat 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2560 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 
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aaaaccttga cctgccccac ggactgcttc 
tgtggttcgg ggccttggtt gacacccaga 
cactacccct gcactgtcaa ctttaccatc 
gagcacaggc tcgaagccgc atgcaattgg 
agggacagat cagagcttag cccgctgctg 
tgttccttca ccaccctacc ggctctgtcc 
gtggacgtac aatacctgta cggtataggg 
gagtatgtcc tgttgctctt ccttcttctg 
atgatgctgc tgatagctca agctgaggcc 
gcatccgtgg ccggggcgca tggcattctc 
tacatcaagg gcaggctggt ccctggggcg 
ctcctgctcc tgctggcgtt accaccacga 
tcgtgcggag gcgcggtttt cgtaggtctg 
ctgttcctcg ctaggctcat atggtggtta 
ttgcaagtgt ggatcccccc cctcaacgtt 
acgtgcgcga tccacccaga gctaatcttt 
ggtccactca tggtgctcca ggctggtata 
gggctcattc gtgcatgcat gctggtgcgg 
gctctcatga agttggccgc actgacaggt 
cgggactggg eccacgcggg cctacgagac 
tctgatatgg agaccaaggt tatcacctgg 
atcttgggcc tgcccgtctc cgcccgcagg 
agccttgaag ggcaggggtg gcgactcctc 
cgaggcctac ttggctgcat catcactagc 
ggggaggtcc aagtggtctc caccgcaaca 
gtgtgttgga ctgtctatca tggtgccggc 
atcacccaaa tgtacaccaa tgtggaccag 
gcgcgttcct tgacaccatg cacctgcggc 
gecgatgtCa ttccggtgcg ccggcggggc 
cccgtctcct acttgaaggg ctcttcgggc 
gtgggcatet fctcgggefcge cgtgtgcacc 
cccgtcgagt ctatggaaac cactatgcgg 
ccggccgtac cgcagacatt ccaggtggcc 
agcactaagg tgccggctgc gtatgcagcc 
tccgtcgccg ccaccctagg tttcggggcg 
aaeatcagaa tcggggtaag gaccatcacc 
ggcaagtttc ttgccgacgg tggttgctct 
gagtgccact caactgactc gaccactatc 
gagacggctg gagcgcgact cgtcgtgctc 
gtgccacatc caaacatcga ggaggtggct 
ggcaaagcca tccccatcga gaccatcaag 
aagaagaaat gtgatgagct cgccgcgaag 
tattaccggg gccttgatgt atccgtcata 
acggacgctc taatgecggg ctttaccggt 
tgtgtcacec agacagtcga cttcagcctg 
gtgccacaag acgcggtgtc acgctcgcag 
ggcatttaca ggtttgtgac tccaggagaa 
ctgtgcgagt gctatgacgc gggctgtgct 
gttaggttgc gggcttacct aaacacacca 
ttctgggaga gcgtctfctac aggcctcacc 
aagcaggcag gagacaactt cccctacctg 
gctcaggctc cacctccatc gtgggaccaa 
acgctgcacg ggccaacgcc cctgctgCat 
accacacacc ccataaccaa atacatcatg 
acgagcacct gggtgctggt aggcggagtc 
acaggcagcg tggtcattgt gggcaggatc 
gacagggaag tcctttaceg ggagttcgat 
tacatcgaac agggaatgcu gctcgccgaa 
caaacagcca ccaagcaagc ggaggctgct 
atcgaagcct tctgggcgaa gcatatgtgg 
ggcttgtcca ctctgcctgg caaccccgcg 
atcaccagcc cgctcaccac ccaacatacc 
gccgcccaac ttgctcctcc cagcgctgct 
gcggctgttg gcagcatagg ccttgggaag 
gcaggggtgg caggcgcgct cgtggccttt 
gaggacctgg ttaacctact ccctgctatc 



cggaagcacc ccgaggccac ttacaccaag 3600 
tgcttggtcc actacccata caggctttgg 3660 
ttcaaggtta ggatgtacgt ggggggagtg 3720 
actcgaggag agcgttgtaa cctggaggac 3780 
ctgtctacaa cggagtggca ggtatcgccc 3840 
actggtttga tccatctcca tcagaacgtc 3900 
tcggcggttg tctcctttgc aatcaaatgg 3960 
gcggacgcgc gcgtetgtgc ctgcttgtgg 4 020 
gccctagaga acctggtggt ectcaacgcg 4080 
tccttcctcg tgttcttctg tgctgcctgg 4140 
gcatatgccc tctacggcgt atggccgcta 4200 
gcatacgcca tggaccggga gatggcagca 4260 
atactcttga ccttgtcacc gcactataag 4 320 
caatatttta tcaccagggc cgaggcacac 4380 
cgggggggcc gcgatgccgt catcctcctc 4440 
accatcacca aaatcttgct cgccatactc 4500 
accaaagtgc cgtacttcgt gcgcgcacac 4S60 
aaggttgctg ggggtcatta tgtccaaatg 4620 
acgtacgttt atgaccatct caccccactg 4680 
cttgcggtgg cagttgagcc cgtcgtcttc 4740 
ggggcagaca ccgcggcgtg cggggacatc 4800 
gggagggaga tacatctggg accggcagac 4 660 
gcgcctatta cggcctactc ccaacagacg 4920 
ctcacaggcc gggacaggaa ccaggtcgag 4 980 
caatctttcc tggcgacctg cgtcaatggc 504 0 
tcaaagaccc ttgccggccc aaagggccca 5100 
gacctcgtcg gctggcaagc gccccccggg 5160 
agctcggacc tttacttggt cacgaggcat S220 
gacagcaggg ggagcctact ctcccccagg 5280 
ggtccactgc tctgcccctc ggggcacgct 5340 
cgaggggttg cgaaggcggt ggactttgta 5400 
tccccggtct tcacggacaa ctcgCcccct 5460 
catctacacg cccctactgg tagcggcaag 5520 
caagggtata aggtgcttgt cctgaacccg 5580 
tatatgtcta aggcacatgg tatcgaccct 564 0 
acgggtgccc ccatcacgta ctccacctat 5700 
gggggcgcct atgacatcat aatatgtgat 5760 
ctgggcatcg gcacagtcct ggaccaagcg 5620 
gccaccgcta cgcctccggg atcggtcacc 5880 
ctgtccogca ctggagaaat ccccttttat 5940 
ggggggaggc acctcatttt ctgccattcc 6000 
ctgtccggcc tcggactcaa tgctgtagca 6060 
ccaactagcg gagacgtcat tgtcgtagca 6120 
gacttcgact cagtgatega ctgcaataca 6180 
gacccgacct tcaccattga gacgacgacc 624 0 
cggcgaggca ggactggtag gggcaggatg 6300 
cggccctcgg gcatgttcga ttcctcggtt 6360 
tggtacgagc tcacgcccgc cgagacctca 6420 
gggttgcecg tctgccagga ccatctggag 6480 
cacatagacg cccatttctt gtcccagact 6540 
gtagcatacc aggctacggt gtgcgccagg 6600 
atgtggaagt gtctcatacg gctaaagcct 6660 
aggctgggag ccgttcaaaa cgaggttact 6720 
gcatgcatgt cggctgacct ggaggtcgtc 6780 
ctagcagctc tggccgcgta ttgcctgaca 6840 
atcttgtccg gaaagccggc catcattccc 6900 
gagatggaag agtgcgcctc acacctccct 6960 
caattcaaac agaaggcaat cgggttgctg 7020 
gctcccgtgg tggaatccaa gtggcggacc 7060 
aatttcatca gcgggataca atatttagca 7140 
atagcatcac tgatggcatt cacagcctct 7200 
ctcctgttta acatcctggg gggatgggtg 7260 
tctgctttcg taggcgccgg catcgctgga 7320 
gtgcttgtgg atattttggc aggttatgga 7380 
aaggtcatga gcggcgagat gccctccacc 7440 
ctctcccctg gcgccctagt cgtcggggtc 7500 
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gtgtgcgcag cgatactgcg tcggcacgtg 
aaccggctga tagcgttcgc ttcgcggggt 
gagagcgacg ctgcagcacg tgtcactcag 
ctgaagaggc ttcaccagtg gatcaacgag 
ctaagagatg tttgggattg gatatgcacg 
tccaagctcc tgccgcgatt gccgggagtc 
ggagtctggc ggggcgacgg catcatgcaa 
ggacatgtga aaaacggttc catgaggatc 
catggaacat tccccattaa cgcgtacacc 
aattattcta gggcgctgtg gcgggtggct 
ggggatttcc actacgtgac gggcatgacc 
ccggcccccg aattcttcac agaagtggat 
tgcaaacccc tcctacggga ggaggtcaca 
gggtcacagc tcccatgcga gcccgaaccg 
gacccctccc acattacggc ggagacggct 
cccttggcca get cat cage tagccagctg 
acccgtcatg actccccgga cgctgacctc 
atgggcggga acatcacccg cgtggagtca 
gagccgctcc aagcggagga ggatgagagg 
aggtccagga aattccctcg agcgatgccc 
ctgttagagt cctggaagga cccggactac 
ccgcctgcca aggcccctcc gataccacct 
gaatctaccg tgtcttctgc cttggcggag 
tcgtcggccg tcgacagcgg cacggcaacg 
gacgcgggat ccgacgttga gtcgtactcc 
gatcccgatc tcagcgacgg gtcttggtct 
gtctgctgct cgatgtccta cacatggaca 
gaaaccaagc tgcccatcaa tgcactgagc 
tatgctacaa catctcgcag cgcaagcctg 
caggtcctgg acgaccacta ccgggacgtg 
gttaaggcta aacttctatc cgtggaggaa 
agatctaaat ttggctatgg ggcaaaggac 
cacatccgct ccgtgtggaa ggacttgctg 
atcatggcaa aaaatgaggt tttctgcgtc 
cgccttatcg tattcccaga tttgggggtt 
gtggtctcca ccctccctca ggccgtgatg 
ggacagcggg tcgagttcct ggtgaatgcc 
gcatatgaca cccgctgttt tgactcaacg 
tcaatctacc aatgttgtga cttggccccc 
gagcggcttt acatcggggg ceccctgact 
cggtgccgcg cgagcggtgt actgacgacc 
aaggccgctg cggcctgtcg agctgcgaag 
gacgaccttg tcgttatctg tgaaagcgcg 
gccttcacgg aggctatgac tagatactct 
tacgacttgg agttgataac atcatgctcc 
ggcaaaaggg tgtactatct cacccgtgac 
gagacagcta gacacactcc agtcaattcc 
accttgtggg caaggatgat cctgatgact 
caacttgaaa aagccctaga ttgtcagatc 
gacctacctc agatcattca acgactccat 
tctccaggtg agatcaatag ggtggcttca 
cgagtctgga gacatcgggc cagaagtgtc 
gctgccactt gtggcaagta cctcttcaac 
ccaatcccgg ctgcgtccca gttggattta 
ggagacatat atcacagcct gtctcgtgcc 
ctactttctg taggggtagg catctatcta 
ctccaggcca ataggccatc ctgttttttt 
tttttttttt cttttttttc tccttttttt 
tggctccatc ttagccctag tcacggctag 
agagagtgct gatactggcc tctctgcaga 



ggcccagggg agggggctgt gcagtggatg 7560 
aaccacgtct cccccacgca ctatgtgcct 7620 
atcctctcta gtcttaccat cactcagctg 76B0 
gactgctcca cgccatgctc cggctcgtgg 77 4 0 
gtgttgactg atttcaagac ctggctccag 7800 
cccttcttct catgtcaacg tgggtacaag 7860 
accacctgcc catgtggggc acagatcacc 7920 
gtggggccta ggacctgtag taacacgtgg 7980 
acgggcccct gcacgccctc cccggcgcca 8040 
gctgaggagt acgtggaggt tacgcgggtg 6100 
actgacgacg taaagtgccc gtgtcaggtt 8160 
ggggtgcggt tgcacaggta cgctccagcg 8220 
ttcctggtcg ggctcaatca atacctggtt 8280 
gatgtagcag tgctcacttc catgctcacc 8340 
aagcgtaggc tggccagggg atctcctccc 8400 
tctgcgcctt ccttgaaggc aacatgcact 8460 
atcgaggcca acctcctgtg gcggcaggag 8520 
gaaaataagg tagtaatttt ggactctttc 8580 
gaagtatccg ttccggcgga gatcctgcgg 8640 
atatgggcac gcccggatta caaccctcca 8700 
gtccctccag tggtacacgg gtgtccattg 8760 
tcacggagga agaggacggt tgtcctgtca 8820 
ctcgccacag agaccttcgg cagctccgaa 8880 
gcctctcctg accagccctc cgacgacggc 894 0 
tccatgcccc cccttgaggg ggagccgggg 9000 
accgtaagcg aggaggctag tgaggacgtc 9060 
ggcgccctga tcacgccatg cgcfcgcggag 9120 
aactctttgc tccgtcacca caacttggtc 9160 
cggcagaaga aggtcacctt tgacagactg 9240 
ctcaaggaga tgaaggcgaa ggcgtccaca 9300 
gcctgtaagc tgacgccccc acattcggcc 9360 
gtccggaacc tatccagcaa ggccgttaac 9420 
gaagacactg agacaccaat tgacaccacc 9480 
caaccagaga aggggggccg caagccagct 954 0 
cgtgtgtgcg agaaaatggc cctttacgat 9600 
ggctcttcat acggattcca atactctcct 9660 
tggaaagcga agaaatgccc tatgggcttc 9720 
gtcactgaga atgacatccg tgttgaggag 9780 
gaagccagac aggccataag gtcgctcaca 9840 
aattctaaag ggcagaactg cggctatcgc 9900 
agctgcggta ataccctcac atgttacttg 9960 
ctccaggact gcacgatgct cgtatgcgga 10020 
gggacccaag aggacgaggc gagcctacgg 10080 
gccccccctg gggacccgcc caaaccagaa 10140 
tccaatgtgt cagtcgcgca cgatgcatct 10200 
cccaccaccc cccttgcgcg ggctgcgtgg 10260 
tggctaggca acatcatcat gtatgcgccc 10320 
catttcttct ccatccttct agctcaggaa 10360 
tacggggcct gttactccat tgagccactt 104 40 
ggccttagcg cattttcact ccatagttac 10500 
tgcctcagga aacttggggt accgcccttg 10560 
cgcgctaggc tactgtccca gggggggagg 10620 
tgggcagtaa ggaccaagct caaactcact 10680 
tccagctggt tcgttgctgg ttacagcggg 10740 
cgaccccgct ggttcatgtg gtgcctactc 10800 
ctccccaacc gatgaacggg gagctaaaca 10860 
cccttttttt ttttcttttt tttttttttt 10920 
ttcctctttt tttccttttc tttcctttgg 10980 
ctgtgaaagg tccgtgagcc gcttgactgc 11040 
tcaagt 11076 
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<210> 10 
<211> 8001 
<212> DNA 

<213> Hepatitis C Virus 
<400> 10 

gccagccccc gattgggggc gacactccac 
tcttcacgca gaaagcgtct agccatggcg 
cccccctccc gggagagcca tagtggtctg 
gacgaccggg tcctttettg gatcaacccg 
gcgagactgc tagccgagta gtgttgggtc 
gtgcttgcga gtgccccggg aggtctcgta 
ctcaaagaaa aaccaaacgt aacoccaacg 
acgcaggttc tccggccgct tgggtggaga 
caatcggctg ctctgatgcc gccgtgttcc 
ttgtcaagac cgacctgtcc ggtgccctga 
cgtggctggc cacgacgggc gttccttgcg 
gaagggactg gctgctattg ggcgaagtgc 
ctcctgccga gaaagtatcc atcatggctg 
cggctacctg cccattcgac caccaagcga 
tggaagccgg tcfctgtcgat caggatgatc 
ccgaactgtt cgccaggctc aaggcgcgca 
atggcgatgc ctgcttgccg aatatcatgg 
actgtggccg gctgggtgtg gcggaccgct 
ttgctgaaga gcttggcggc gaatgggctg 
ctcccgattc gcagcgcatc gccttctatc 
cagaccacaa cggtttccct ctagcgggat 
aacgttactg gccgaagccg cttggaataa 
tccaccatat tgccgtettt tggcaatgtg 
acgagcattc ctaggggtct ttcccctctc 
gtgaaggaag cagttcctet ggaagcttct 
tgcaggcagc ggaacccccc acctggcgac 
taagatacac ctgcaaaggc ggcacaaccc 
gaaagagtca aatggctctc ctcaagcgta 
gtaccccatt gtatgggatc tgatctgggg 
fccgaggttaa aaaacgtcta ggccccccga 
eacgataata ccatggcgcc tattacggcc 
tgcatcatca ctagcctcac aggccgggac 
gtctccaccg caacacaatc tttcctggcg 
tafccatggtg ccggctcaaa gacccttgcc 
accaatgtgg accaggacct cgtcggctgg 
ccatgcacct gcggcagctc ggocctttac 
gtgcgccggc ggggcgacag cagggggagc 
aagggctctt egggeggtcc actgctctgc 
gctgccgtgt gcacccgagg ggttgcgaag 
ggaaccacta tgcggtcccc ggtcttcacg 
acattccagg tggcccatct acacgcccct 
gctgcgtatg caggccaagg gtataaggtg 
ctaggtttcg gggcgtatat gtctaaggca 
gtaaggacca tcaccacggg tgcccccatc 
gacggtggtt gctctggggg cgcctatgac 
gactcgacca ctatcctggg catcggcaca 
cgactcgtcg tgctcgccac cgctacgcct 
atcgaggagg tggctctgtc cagcactgga 
atcgagacca tcaagggggg gaggcacctc 
gagctcgccg cgaagctgtc cggcctcgga 
gatgtatccg tcataccfac tagcggagac 
acgggcttta ccggcgactt cgactcagtg 
gtcgacttca gcctggaccc gaccttcacc 
gtgtcacgct cgcagcggcg aggcaggact 
gtgactccag gagaacggcc ctcgggcatg 
gaegcgggct gtgcttggta cgagctcacg 
tacctaaaca caccagggtt gcccgtctgc 
tttacaggcc tcacccacat agacgcccat 
aacttcccct acctggtagc ataccaggct 



catagatcac tcccctgtga ggaactactg 60 
ttagtatgag tgtcgtgcag cctccaggac 120 
cggaaccggt gagtacaccg gaattgccag 180 
ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgaaaggcc ttgtggtact gcctgatagg 300 
gaccgtgcac catgagcacg aatcctaaac 360 
ggcgcgccat gattgaacaa gatggattgc 420 
ggctattcgg ctatgactgg gcacaacaga 480 
ggctgtcagc gcaggggcgc ccggttcttt 540 
atgaactgca ggacgaggca gcgcggctat 600 
cagctgtgct cgacgttgtc aotgaagcgg 660 
cggggcagga tctcetgtca tctcaccttg 720 
atgcaatgcg gcggctgcat acgcttgatc 780 
aacatcgcat cgagcgagca cgtactcgga 840 
tggacgaaga gcatcagggg ctcgcgccag 900 
tgcccgacgg cgaggatctc gtcgtgaccc 960 
tggaaaatgg ccgcttttct ggattcatcg 1020 
atcaggacat agcgttggct acccgtgata 1080 
accgcttcct cgtgctttac ggtatcgccg 114 0 
gccttcttga Cgagttcttc tgagtttaaa 1200 
caattccgcc cctctccctc ccccccccct 1260 
ggccggtgtg cgtttgtcta tatgttattt. 1320 
agggcccgga aacctggccc tgtcttcttg 1380 
gccaaaggaa tgcaaggtct gttgaatgtc 1440 
tgaagacaaa caacgtctgt agcgaccctt 1500 
aggtgcctct gcggccaaaa gccacgtgta 1560 
cagtgccacg ttgtgagttg gatagttgtg 1620 
ttcaacaagg ggctgaagga tgcccagaag 1680 
cctcggtgca catgctttac atgtgtttag 1740 
accacgggga cgtggttttc ctttgaaaaa 1800 
tactcccaac agacgcgagg cctacttggc 1860 
aggaaccagg tcgaggggga ggtccaagtg 1920 
acctgcgtca atggcgtgtg ttggactgtc 1980 
ggcccaaagg gcccaatcac ccaaatgtac 2040 
caagcgcccc ccggggcgcg ttccttgaca 2100 
ttggtcacga ggcatgccga tgtcattccg 2160 
ctactctccc ccaggcccgt ctcctacttg 2220 
ccctcggggc acgctgtggg catctttcgg 2280 
gcggtggact ttgtacccgt cgagtctatg 2340 
gacaactcgt cccctccggc cgtaccgcag 2400 
actggtagcg gcaagagcac taaggtgccg 2460 
cttgtcctga acccgtccgt cgccgccacc 2 520 
catggtatcg accctaacat cagaatcggg 2580 
acgtactcca cctatggcaa gtttcttgcc 2640 
atcataatat gtgatgagtg ccactcaact 2700 
gtcctggacc aagcggagac ggctggagcg 2760 
ccgggatcgg tcaccgtgcc acatccaaac 2820 
gaaatcccct tttatggcaa agccatcccc 2880 
attttctgcc attccaagaa gaaatgtgat 294 0 
ctcaatgctg tagcatatta ccggggcctt 3000 
gtcattgtcg tagcaacgga cgctctaatg 3060 
atcgactgca atacatgtgt cacccagaca 3120 
attgagacga cgaccgtgcc acaagacgcg 3180 
ggtaggggca ggatgggcat ttacaggttt 3240 
ttcgattcct cggttctgtg cgagtgctat 3300 
cccgccgaga cctcagttag gttgcgggct 3360 
caggaccatc tggagttctg ggagagcgtc 3420 
ttcttgtccc agactaagca ggcaggagac 34 80 
acggtgtgcg ccagggctca ggctccacct 354 0 
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ccatcgtggg accaaaLgtg gaagtgtctc atacggctaa agcctacgct gcacgggcca 3600 
acgcccctgc tgtataggct gggagccgtt caaaacgagg ttactaccac acaccccata 3660 
accaaataca tcatggcatg catgtcggct gacctggagg tcgtcacgag cacctgggtg 3720 
ctggtaggcg gagtcctagc agctctggcc gcgtattgcc tgacaacagg cagcgtggtc 3780 
attgtgggca ggatcatctt gtccggaaag ccggccatca ttcccgacog ggangtcctt 3640 
taccgggagt tcgatgagat ggaagagtgc gcctcacacc tcccttacat cgaacaggga 3900 
atgcagctcg ccgaacaatt caaacagaag gcaatcgggt tgctgcaaac agccaccaag 3960 
caagcggagg ctgctgctcc cgtggtggaa tccaagtggc ggaccatcga agccttctgg 4020 
gcgaagcata tgtggaattt catcagcggg atacaatatt tagcaggctt gtccactctg 4080 
cctggcaacc ccgcgatagc atcactgacg gcattcacag cctccatcac cagcccgctc 4140 
accacccaac ataccctcct gtttaacatc ctggggggat gggtggccgc ccaacttgct 4200 
cctcccagcg ctgcttctgc tttcgtaggc gccggcatcg ctggagcggc tgttggcagc 4260 
ataggcettg ggaaggtgct tgtggatatt ttggcaggtt atggagcagg ggtggcaggc 4320 
gcgctcgtgg cctttaaggt catgagcggc gagttgccct ccaccgagga cctggttaac 4380 
ctactccctg ctatcctctc ccctggcgcc ctagtcgtcg gggtcgtgtg cgeagegata 4 4 40 
ctgcgtcggc acgtgggccc aggggagggg gctgtgcagt ggatgaaccg gctgatagcg 4500 
ttcgcttcgc ggggtaacca cgtctccccc acgcactatg tgcctgagag cgacgctgca 4560 
gcocgagtca ctcagatcct ctctagtctt accatcactc agctgctgaa gaggcttcac 4620 
cagtggatca acgaggactg ctccacgcca tgctccggct cgtggctaag agatgtttgg 4680 
gattggafcat gcacggtgtt gactgatttc aagacctggc tccagtccaa gctcctgccg 474 0 
cgattgccgg gagtcccctt cttctcatgt caacgtgggt acaagggagt ctggcggggc 4 800 
gacggcatca tgcaaaccac ctgcccatgt ggagcacaga tcaccggaca tgtgaaaaac 4860 
ggttccatga ggatcgtggg gcctaggacc tgtagtaaca cgtggcatgg aacattcccc 4920 
attaacgcgt acaccacggg cccctgcacg ccctccccgg cgccaaatta ttctagggcg 4980 
ctgtggcggg taggtgctga ggagtacgtg gaggttacgc gggtggggga tttccactac 5040 
gtgacgggca tgaeeaetga caacgtaaag tgcecgtgtc aggttccggc ccccgaattc 5X00 
ttcacagaag tggatggggt gcggttgcac aggtacgctc cagcgtgcaa acccctccta 5160 
cgggaggagg tcacattcct ggtcgggctc aatcaatacc tggttgggtc acagctccca 5220 
tgcgagcctg aaccggatgt agcagtgctc acttccatgc tcaccgaccc ctcccacatt 5280 
acggcggaga cggctaagcg taggctggcc aggggatctc cccccccctt ggccagctca 5340 
tcagctagcc agctgtctgc gccttccttg aaggcaacat gcactacccg tcatgactcc 5400 
ccggacgctg acctcatcga ggccaacctc ctgtggcggc aggagatggg cgggaacatc 54 60 
acccgcgtgg agtcagaaaa taaggtagta attttggact ctttcgagcc gctccaagcg 5520 
gaggaggatg agaggggagt atccgttccg gcggagatcc tgcggaggtc caggaaattc 5580 
cctcgagcga tgcccatatg ggcacgcccg gattacaacc ctccactgtt agagtectgg 564 0 
aaggacccgg actacgtccc tccagtggta cacgggtgtc cattgccgcc tgccaaggcc 5700 
cctccgatac eaectteacg gaggaagagg acggttgtcc tgtcagaatc taccgtgtct 5760 
tctgccttgg cggagctcgc cacagagacc ttcggcagct ccgaatcgtc ggccgtcgac 5820 
agcggcacgg caacggcctc tcctgaccag ccctccgacg acggcgacgc gggatccgac 5880 
gttgagtcgt actcctccat gccccccctt gagggggagc cgggggatcc cgatctcagc 594 0 
gacgggtctt ggtctaccgt aagcgaggag gctagtgagg acgtcgtctg ctgetcgatg 6000 
tcctacacat ggacaggcgc cctgatcacg ccatgcgctg cggaggaaac caagctgccc 6060 
atcaatgcac tgagcaactc tttgctecgt caccacaact tggtctatgc tacaacatct 6120 
cgcagcgcaa acctgcggca gaagaaggtc acctttgaca gactgcaggt cctggacgac 6180 
cactaccggg acgtgctcaa ggagatgaag gcgaaggcgt ccacagttaa ggctaaactt 6240 
ctatccgtgg aggaagcctg taagctgacg cccccacatt cggccagatc taaatttggc 6300 
tatggggcaa aggacgtccg gaacctatcc agcaaggccg ttaaccacat ccgctccgtg 6360 
tggaaggact tgctggaaga cactgagaca ccaattgaca ccaccatcat ggcaaaaaat 6420 
gaggttttct gcgtccaacc agagaagggg ggccgcaagc cagctcgcct tatcgtattc 6480 
ccagatttgg gggttcgtgt gtgcgagaaa atggcccttt acgatgtggt ctccaccctc 654 0 
cctcaggccg tgatgggcto ttcatacgga ttccaatact ctcctggaca gcgggtcgag 6600 
ttcctggtga atgcctggaa agcgaagaaa tgccctatgg gcttcgcata tgacacccgc 6660 
tgttttgact caacggtcac tgagaatgac atccgtgttg aggagtcaat ctaccaatgt 6720 
tgtgacttgg cccccgaagc cagacaggcc ataaggtcgc tcacagagcg gctttacatc 6780 
gggggccccc tgactaattc taaagggcag aactgcggct atcgccggtg ccgcgcgagc 684 0 
ggtgtactga cgaccagctg cggtaatacc ctcacatgtt acttgaaggc cgctgcggcc 6900 
tgtcgagctg cgaagctcca ggactgcacg atgctcgtat gcggagacga ccttgtcgtt 6960 
atctgtgaaa gcgcggggac ccaagaggac gaggcgagcc tacgggcctt cacggaggct 7020 
atgactagat actctgcccc ccctggggac ccgcccaaac cagaatacga cttggagttg 7080 
ataacatcat gctcctccaa tgtgtcagtc gcgcacgatg catctggcaa aagggtgtac 714 0 
tatctcaccc gtgaccccac cacccccctt gcgcgggctg cgtgggagac agctagacac 7200 
actccagtca attcctggct aggcaacatc atcatgtatg cgcccacctt gtgggcaagg 7260 
atgatectga tgactcattt cttctccatc cttctagctc aggaacaact tgaaaaagcc 7320 
ctagattgtc agatctacgg ggcctgttac tccattgagc cacttgacct acctcagatc 7380 
atteaaegae tccatggcct tagcgcattt tcactccata gttactctcc aggtgagatc 744 0 
aatagggtgg cttcatgcct caggaaactt ggggtaccgc ccttgcgagt ctggagacat 7500 
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cgggccagaa gtgtccgcgc taggctactg 
aagtacctct tcaactgggc agtaaggacc 
tcccagttgg atttatccag ctggttcgtt 
agcctgtctc gtgcccgacc ccgctggttc 
gtaggcatct atctactccc caaccgatga 
ccatcctgtt tttttccctt tttttttttc 
ttttctcctt tttttttcct ctttttttcc 
cctagtcacg gctagctgtg aaaggtccgt 
tggcctctct gcagatcaag t 



tcccaggggg ggagggctgc cacttgtggc 7560 
aagctcaaac tcactccaat cccggctgcg 7620 
gctggttaca gcgggggaga catatatcac 7680 
atgtggtgcc tactcctact ttctgtaggg 7740 
acggggagct aaacactcca ggccaatagg 7800 
tttttttttt tttttttttt tttttttttt 7860 
ttttctttcc tttggtggct ccatcttagc 7920 
gagccgcttg actgcagaga gtgctgatac 7980 

8001 
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<210> 11 
<211> 11076 
<212> DNA 

<213> Hepatitis C Virus 
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<400> 11 

gccagccccc 

tcttcacgca 

cccccctccc 

gacgaccggg 

gcgagactgc 

gtgcttgcga 

ctcaaagaaa 

acgcaggttc 

caatcggctg 

ttgtcaagac 

cgtggctggc 

gaagggactg 

ctcctgccga 

cggctacctg 

tggaagccgg 

ccgaactgtt 

atggcgatgc 

actgtggccg 

ttgctgaaga 

ctcccgattc 

cagaccacaa 

aacgttactg 

tccaccatat 

acgagcattc 

gtgaaggaag 

tgcaggcagc 

taagatacac 

gaaagagtca 

gtaccccatt 

tcgaggttaa 

cacgataata 

cgccgcccac 

ttgccgcgca 

caacctcgtg 

gctcagcccg 

ctcctgtcac 

cgcaatttgg 

attccgctcg 

gttctggagg 

ttccttttgg 

gtatccggag 

gcggacatga 

cgctgctggg 

acgatacgac 

gtgggagatc 

cggcacgaga 

cgtatggctt 

ttactccgga 

gcgggccttg 

ctctttgccg 

ctcgggatta 

aacggcagct 

ttccttgctg 

gccagctgca 

tcacacagct 

gtacccgcgg 

gggacgaccg 

ctgcttctta 

agcactgggt 



gattgggggc 
gaaagcgtct 
gggagagcca 
tcctttcttg 
tagccgagta 
gtgccccggg 
aaccaaacgt 
tccggccgct 
ctctgatgcc 
cgacctgtcc 
cacgacgggc 
gctgctattg 
gaaagtatcc 
cccattcgac 
tcttgtcgat 
cgccaggctc 
ctgettgccg 
gctgggtgtg 
gcttggcggc 
gcagcgcatc 
cggtttccct 
gccgaagccg 
tgccgtcttt 
ctaggggtct 
cagttcctct 
ggaacccccc 
ctgcaaaggc 
aatggctctc 
gtatgggatc 
aaaacgtcta 
ccatgggcac 
aggacgtcaa 
ggggccccag 
gaaggcgaca 
ggtacccctg 
cccgtggctc 
gtaaggtcat 
tcggcgcccc 
acggcgtgaa 
ctttgctgtc 
tgtaccatgt 
tcatgcatac 
tagcgctcac 
gccatgtcga 
tctgcggatc 
cagtacagga 
gggatatgat 
tcccacaagc 
cctactattc 
gcgttgacgg 
cgtccctctt 
ggcacatcaa 
cgctgttcta 
gccccatcga 
cggaccagag 
cgcaggtgtg 
accggttcgg 
acaacacgcg 
tcaccaagac 



gacactccac 
agccatggcg 
tagtggtctg 
gatcaacccg 
gtgttgggtc 
aggtctcgta 
aacaccaacg 
tgggtggaga 
gccgtgttcc 
ggtgccctga 
gttccttgcg 
ggcgaagtgc 
atcatggctg 
caccaagcga 
caggatgatc 
aaggcgcgca 
aatatcatgg 
gcggaccgct 
gaatgggctg 
gccttctatc 
ctagcgggat 
cttggaataa 
tggcaatgtg 
ttcccctctc 
ggaagcttct 
acctggcgac 
ggcacaaccc 
ctcaagcgta 
tgatctgggg 
ggccccccga 
gaatcctaaa 
gtteecgggc 
gttgggtgtg 
acctatcccc 
gcccctctat 
tcggcctagt 
cgataccctc 
cctagggggc 
ctatgcaaca 
ctgtttgacc 
cacgaacgac 
ccccgggtgc 
tcccacgctc 
tttgctcgtt 
tgttttcctc 
otgcaattgc 
gatgaactgg 
tgtcgtggat 
catggtgggg 
gggaacctat 
ttcacccggg 
caggactgcc 
cgtgcacaag 
cgcgttcgct 
gccttattgt 
tggtccagtg 
cgtccctacg 
gccgccgcaa 
gtgcgggggc 



catagatcac 
ttagtatgag 
cggaaccggt 
ctcaatgcct 
gcgaaaggcc 
gaccgtgcac 
ggcgcgccat 
ggctattcgg 
ggctgtcagc 
atgaactgca 
cagctgtgct 
cggggcagga 
atgcaatgcg 
aacatcgcat 
tggacgaaga 
tgcccgacgg 
tggaaaatgg 
atcaggacat 
accgcttcct 
gccttcttga 
caattccgcc 
ggccggtgtg 
agggcccgga 
gccaaaggaa 
tgaagacaaa 
aggtgcctct 
cagtgccacg 
ttcoacoagg 
cctcggtgca 
accacgggga 
cctcaaagaa 
ggtggtcaga 
cgcgcgacta 
aaggctcgcc 
ggcaatgagg 

tggggcccca 

acgtgcggct 
gctgccaggg 
gggaatctgc 
atcccagctt 
tgctccaacg 
gtgccctgcg 
gcggccagga 
ggggcggctg 
gtcgcccagc 
tcaatatatc 
tcacctacag 
atggtggcgg 
aactgggcta 
gtgacagggg 
tcatcccaga 
ctgaactgca 
ttcaactcat 
caggggtggg 
tggcactacg 
tactgcttca 
tacagttggg 
ggcaactggt 
cccccgtgta 



tcccctgtga 
tgtcgtgcag 
gagtacaccg 
ggagatttgg 
ttgtggtact 
catgagcacg 
gattgaacaa 
ctatgactgg 
gcaggggcgc 
ggacgaggca 
cgacgttgtc 
tctcctgtca 
gcggctgcat 
cgagcgagca 
gcatcagggg 
cgaggatctc 
ccgcttttct 
agcgttggct 
cgtgctttac 
cgagttcttc 
cctctccctc 
cgtttgtcta 
aacctggccc 
tgcaaggtct 
caacgtctgt 
gcggccaaaa 
ttgtgagttg 
ggctgaagga 
catgctttac 
cgtggttttc 
aaaccaaacg 
tcgtcggtgg 
ggaagacttc 
agcccgaggg 
gcttggggtg 
cggacccccg 
tcgccgatct 
ccctggcgca 
ccggttgctc 
ccgcttatga 
caagcattgt 
ttcgggagaa 
acgctagcgt 
ctctctgctc 
tgttcacett 
ccggccacgt 
cagccctagt 
gggcccattg 
aggttctgat 
ggacgatggc 
aaatccagct 
atgactccct 
ctggatgccc 
ggcccatcac 
caccccggcc 
ccccaagccc 
gggagaatga 
ttggctgtac 
acatcggggg 



ggaactactg 

cctccaggac 

geattgccag 

gcgtgccccc 

gcctgatagg 

aatcctaaac 

gatggattgc 

gcacaacaga 

ccggttcttt 

gcgcggctat 

actgaagcgg 

Cctcaccttg 

acgcttgatc 

cgtactcgga 

ctcgcgccag 

gtcgtgaccc 

ggattcatcg 

acccgtgata 

ggtatcgccg 

tgagtttaaa 

ccccccceet 

tatgttattt 

tgtcttcttg 

gttgaatgtc 

agcgacccfct 

gccacgtgta 

gatagttgtg 

tgcccagaag 

atgtgtttag 

ctttgaaaaa 

taacaccaac 

agtttacctg 

cgagcggtcg 

tagggcctgg 

ggcaggatgg 

gcgtaggtcg 

catggggtac 

tggcgtccgg 

cttttctatc 

agtgcgcaac 

gtatgaggca 

caactcctcc 

ccccactacg 

cgctatgtac 

ctcgcctcgc 

gacaggtcac 

ggtatcgcag 

gggagtccta 

tgtgatgcta 

caaaaacacc 

tgtaaacacc 

caacactggg 

agagcgcatg 

ttacaatgag 

gtgcggtatc 

tgtcgtggtg 

gacggacgtg 

atggatgaat 

gatcggcaat 
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120 

160 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1B00 

I860 

1920 

1980 

2040 

2100 

2160 

2220 

2260 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 
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aaaaccttga cctgccccac ggactgcttc 
tgtggttcgg ggccttggtt gacacccaga 
cactacccct gcactgtcaa ctttaccatc 
gagcacaggc tcgaagccgc atgcaattgg 
agggacagat cagagcttag cccgctgctg 
tgttccttca ccaccctacc ggctctgtcc 
gtggacgtac aataeotgta cggtataggg 
gagtatgtcc tgttgctctt ccttcttctg 
atgatgctgc tgatagctca agctgaggcc 
gcatccgtgg ccggggcgca tggcattctc 
tacatcaagg gcaggctggt ccctggggcg 
ctcctgctcc tgctggcgtt accaccacga 
tcgtgcggag gcgcggtttt cgtaggtctg 
ctgttcctcg ctaggctcat atggtggtta 
ttgcaagtgt ggatcccccc cctcaacgtt 
acgtgcgcga tccacccaga gctaatcttt 
ggtccactca tggtgctcca ggctggtata 
gggctcattc gtgcatgcat gctggtgcgg 
gctctcatga agttggccgc actgacaggt 
cgggactggg cccacgcggg cctacgagac 
tctgatatgg agaccaaggt tatcacctgg 
atcttgggcc tgcccgtctc cgcccgcagg 
agccttgaag ggcaggggtg gcgactcctc 
cgaggcctac ttggctgcat catcactagc 
ggggaggtcc aagtggtctc caccgcaaca 
gtgtgttgga ctgtetatea tggtgccggc 
atcacccaaa tgtacaccaa tgtggaccag 
gcgcgttcct tgacaccatg cacctgcggc 
gccgatgtca ttccggtgcg ccggcggggc 
cccgtctcct acttgaaggg ctettcgggc 
gtgggcatct ttcgggctgc cgtgtgcacc 
cccgtcgagt ctatgggaac cactatgcgg 
ccggccgtac cgcagacatt ccaggtggcc 
agcactaagg tgccggctgc gtatgcaggc 
tccgtcgccg ccaccctagg tttcggggeg 
aacatcagaa tcggggtaag gaccatcacc 
ggcaagtttc ttgccgacgg tggttgctct 
gagtgccact caactgactc gaccactatc 
gagacggctg gagcgcgact cgtcgtgctc 
gtgccacntc caaacatcga ggaggtggct 
ggcaaagcca tccccatcga gaccatcaag 
aagaagaaat gtgatgagct cgccgcgaag 
tattaccggg gccttgatgt atccgtcata 
acggacgctc taatgacggg ctttaccggc 
tgtgtcaccc agacagtcga cttcagcctg 
gtgccacaag acgcggtgtc acgctcgcag 
ggcatttaca ggtttgtgac tccaggagaa 
ctgtgcgagt gctatgacgc gggctgtgct 
gttaggttgc gggcttacct aaacacacca 
ttctgggaga gcgtctttac aggcctcacc 
aagcaggcag gagacaactt cccctacctg 
gctcaggctc cacctccatc gtgggaccaa 
acgctgcacg ggccaacgcc cctgctgtat 
accacacacc ccataaccaa atacatcatg 
acgagcacct gggtgctggt aggcggagtc 
acaggcagcg tggtcattgt gggcaggatc 
gacagggaag tcctttaccg ggagttcgat 
tacatcgaac agggaatg«*.a gctcgccgaa 
caaacagcca ccaagcaagc ggaggctgct 
atcgaagcct tctgggegaa gcatatgtgg 
ggcttgtcca ctctgcctgg caaccccgcg 
atcaccagcc cgctcaccac ccaacatacc 
gccgcccaac ttgctcctcc cagcgctgct 
gcggctgttg gcagcatagg ccttgggaag 
gcaggggtgg caggcgcgct cgtggcctct 
gaggacctgg ttaacctact ccctgctatc 



cggaagcacc ccgaggccac ttacaccaag 3600 
tgcttggtcc actacccata caggctttgg 3660 
ttcaaggtta ggatgtacgt ggggggagtg 3720 
actcgaggag agcgttgtaa cctggaggac 3780 
ctgtctacaa cggagtggca ggtattgccc 3640 
actggtttga tccatctcca tcagaacgtc 3900 
tcggcggttg tctcctttgc aatcaaatgg 3960 
gcggacgcgc gcgtctgtgc ctgcttgtgg 4020 
gccctagaga acctggtggt cctcaacgcg 4 080 
tccttcctcg tgttcttctg tgctgcctgg 4140 
gcatatgccc tctacggcgt atggccgcta 4200 
gcatacgcca tggaccggga gatggcagca 4260 
atactcttga ccttgtcacc gcactataag 4320 
caatatttta tcaccagggc cgaggcacac 4 380 
cgggggggce gcgatgccgt catcctcctc 4 440 
accatcacca aaatcttgct cgccatactc 4500 
accaaagtgc cgtacttcgt gcgcgcacac 4560 
aaggttgctg ggggtcatta tgtccaaatg 4620 
acgtacgttt atgaccatct caccccactg 4 680 
cttgcggtgg cagttgagcc cgtcgtcttc 4740 
ggggcagaca ccgcggcgtg tggggacatc 4 800 
gggagggaga tacatctggg accggcagac 4 860 
gcgcctatta cggcctactc ccaacagacg 4 920 
ctcacaggcc gggaeaggaa ccaggtcgag 4980 
caatctttcc tggcgacctg cgtcaatggc 5040 
tcaaagaccc ttgccggccc aaagggccca 5100 
gacctcgtcg gctggcaagc gccccccggg 5160 
agctcggacc tttacttggt cacgaggcat 5220 
gacagcaggg ggagcctact ctcccccagg 5280 
ggtccactgc tctgcccctc ggggcacgct 5340 
cgaggggttg cgaaggcggt ggactttgta 54 00 
tccccggtct tcacggacaa ctcgtcccct 5460 
catctacacg cccctactgg tagcggcaag 5520 
caagggtata aggtgcttgt cctgaacccg 5580 
tatatgtcta aggcacatgg tatcgaccct 5640 
acgggtgccc ccatcacgta ctccacctat 5700 
gggggcgcet atgacatcat aatatgtgat 5760 
ctgggcatcg gcacagtcct ggaccaagcg 5820 
gccaccgcta cgcctccggg atcggtcacc 5880 
ctgtccagca ctggagaaat ccccttttat 594 0 
ggggggaggc acctcatttt ctgccattcc 6000 
ctgtccggcc tcggactcaa tgctgtagca 6060 
ccaactagcg gagacgtcat tgtcgtagca 6120 
gacttcgact cagtgatcga ctgcaataca 6180 
gacccgacct tcaccattga gacgacgacc 6240 
cggcgaggca ggactggtag gggcaggatg 6300 
cggccctcgg gcatgttcga ttcctcggtt 6360 
tggtacgagc tcacgccegc cgagacctca 6420 
gggttgcccg tctgccagga ccatctggag 6480 
cacatagacg cccatttctt gtcccagact 654 0 
gtagcatacc aggctacggt gtgcgccagg 6600 
atgtggaagt gtctcatacg gctaaagcct 6660 
aggctgggag ccgttcaaaa cgaggttact 6720 
gcatgcatgt cggctgacct ggaggtcgtc 6780 
ctagcagctc tggccgcgta ttgcctgaca 684 0 
atcttgtccg gaaagccggc catcattccc 6900 
gagatggaag agtgcgcctc acacctccct 6960 
caattcaaac agaaggcaat cgggttgctg 7020 
gctcccgtgg tggaatccaa gtggeggacc 7080 
aatttcatca gcgggataca atatttagca 7140 
atagcatcac tgatggcatt cacagcctct 7200 
ctcctgttta acatcctggg gggatgggtg 7260 
tctgctttcg taggcgccgg catcgctgga 7320 
gtgcttgtgg atatttcggc aggttatgga 7380 
aaggtcatga gcggcgagtt gccctccacc 7440 
ctctcccctg gcgccctagt cgtcggggtc 7500 
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gtgtgcgcag cgatactgcg tcggcacgtg ggcccagggg agggggctgt gcagcggatg 7560 
aaccggctga tagcgttcgc ttcgcggggt aaccacgtct cccccacgca ctatgtgcct 7620 
gagagcgacg ctgcagcacg agtcactcag atcctctcta gtcttaccat cactcagctg 7680 
ctgaagaggc ttcaccagtg gafccaacgag gactgctcca cgccatgctc cggctcgtgg 7740 
ctaagagatg tttgggattg gatatgcacg gtgttgactg atttcaagac ctggctccag 7800 
tccaagctcc tgccgcgatt gccgggagtc cccttcttct catgtcaacg tgggtacaag 7860 
ggagtctggc ggggcgacgg catcatgcaa accacctgcc catgtggagc acagatcacc 7920 
ggacatgtga aaaacggttc catgaggatc gtggggccta ggacctgtag taacacgtgg 7980 
catggaacat tccccattaa cgcgtacacc acgggcccct gcacgccctc cccggcgcca 804 0 
aattattcta gggcgctgtg gcgggtaggt gctgaggagt acgtggaggt tacgcgggtg 8100 
ggggatttcc actacgtgac gggcatgacc actgacaacg taaagtgccc gtgtcaggtt 8160 
ccggcccccg aattcttcac agaagtggat ggggtgcggt tgcacaggta cgcfcccagcg 8220 
tgcaaacccc tcctacggga ggaggtcaca ttcctggtcg ggctcaatca atacctggtt 8280 
gggtcacagc tcccatgcga gcctgaaccg gatgtagcag tgctcacttc catgctcacc 8340 
gacccctccc acattacggc ggagacggct aagcgtaggc tggccagggg atctcccccc 8400 
cccttggcca gctcatcagc tagccagctg tctgcgcctt ccttgaaggc aacatgcact 8460 
acccgtcatg actccccgga cgctgacctc atcgaggcca acctcctgtg gcggcaggag 8520 
atgggcggga acatcacccg cgtggagtca gaaaataagg tagtaatttt ggactctttc 8580 
gagccgctcc aagcggagga ggatgagagg ggagtatccg ttccggcgga gatcctgcgg 864 0 
aggtccagga aattcectcg agcgatgccc atatgggcac gcccggatta caaccctcca 8700 
ctgttagagt cctggaagga cccggactac gtccctccag tggtacacgg gtgtccattg 8760 
ccgcctgcca aggcccctcc gataccacct tcacggagga agaggacggt tgtcctgtca 6820 
gaatctaccg tgtcttctgc cttggcggag ctcgccacag agaccttcgg cagchccgaa 8880 
tcgtcggccg tcgacagcgg cacggcaacg gcctctcctg accagccctc cgacgacggc 8940 
gacgcgggat ccgacgttga gtcgtactcc tccatgcccc cccttgaggg ggagccgggg 9000 
gatcccgatc tcagcgacgg gtcttggtct accgtaagcg aggaggctag tgaggacgtc 9060 
gtctgctgct cgatgtccta cacatggaca ggcgccctga tcacgccatg cgctgcggag 9120 
gaaaccaagc tgcccatcaa tgcactgagc aactctttgc tccgtcacca caacttggtc 9180 
tatgctacaa catctcgcag cgcaaacctg cggcagaaga aggtcacctt tgacagactg 924 0 
caggtcctgg acgaccacta ccgggacgtg ctcaaggaga tgaaggcgaa ggcgtccaca 9300 
gttaaggcta aacttctatc cgtggaggaa gcctgtaagc tgacgccccc acattcggcc 9360 
agatctaaat ttggctatgg ggcaaaggac gtccggaacc tatccagcaa ggccgttaac 9420 
cacatccgct ccgtgtggaa ggacttgctg gaagacactg agacaccaat tgacaccacc 9480 
atcatggcaa aaaatgaggt tttctgcgtc caaccagaga aggggggccg caagccagct 954 0 
cgccttatcg tattcccaga tttgggggtt cgtgtgtgcg agaaaatggc cctttacgat 9600 
gtggtctcca ccctccctca ggccgtgatg ggctcttcat acggattcca atactctcct 9660 
ggacagcggg tcgagttcct ggtgaatgcc tggaaagcga agaaatgccc tatgggcttc 9720 
gcatatgaca cccgctgttt tgactcaacg gtcactgaga atgacatccg tgttgaggag 9780 
tcaatctacc aatgttgtga cttggccccc gaagccagac aggccataag gtcgctcaca 9840 
gagcggcttt acatcggggg ccccctgact aattctaaag ggcagaactg cggctatcgc 9900 
cggtgccgcg cgagcggtgt actgacgacc agctgcggta ataccctcac atgttacttg 9960 
aaggccgctg cggcctgtcg agctgcgaag ctccaggact gcacgatgct cgtatgcgga 10020 
gacgaccttg tcgttatctg tgaaagcgcg gggacccaag aggacgaggc gagcctacgg 10080 
gcct:t:cacgg aggctatgac tagatactct gccccccctg gggacccgcc caaaccagaa 1014 0 
tacgacttgg agttgataac atcatgctcc tccaatgtgt cagtcgcgca cgatgcatct 10200 
ggcaaaaggg tgtactatct cacccgtgac cccaccaccc cccttgcgcg ggctgcgtgg 10260 
gagacagcta gacacactcc agtcaattcc tggctaggca acatcatcat gtatgcgccc 10320 
accttgtggg caaggatgat cctgatgact catttcttct ccatccttct agctcaggaa 10380 
caacttgaaa aagccctaga ttgtcagatc tacggggcct gttactccat tgagccactt 1044 0 
gacctacctc agatcattca acgactccat ggccttagcg cattttcact ccatagttac 10500 
tctccaggtg agatcaatag ggtggcttca tgcctcagga aacttggggt accgcccttg 10560 
cgagtctgga gacatcgggc cagaagtgtc cgcgctaggc tactgtccca gggggggagg 10620 
gctgccactt gtggcaagta cctcttcaac tgggcagtaa ggaccaagct caaactcact 10680 
ccaatcccgg ctgcgtccca gttggattta tccagctggt tcgttgctgg ttacagcggg 10740 
ggagacatat atcacagcct gtctcgtgcc cgaccccgct ggttcatgtg gtgcctactc 10800 
ctactttctg taggggtagg catctatcta ctccccaacc gatgaacggg gagctaaaca 10860 
ctccaggcca ataggccatc ctgttttttt cccttttttt ttttcttttt tttttttttt 10920 
tttttttttt tttttttttc tccttttttt ttcctctttt tttccttttc tttcctttgg 10980 
tggctccatc ttagccctag tcacggctag ctgtgaaagg tccgtgagcc gcttgactgc 11040 
agagagtgct gatactggcc tctctgcaga tcaagt 11076 
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Patentanspruche 

1. Hepatitis C Virus (HCV) Zeilkultursystem, das im wesentlichen eukaryontische Zellen umfaftt, die eingeschleustes 
HCV-spezifisches Genmaterial enthalten , dadurch gekennzeichnet, 

dali die eukaryontischen Zellen humane Hepatomazellen sind und dafi das eingeschleuste HCV-spezifische 
Genmaterial ein HCV-RNA-Konstrukt ist. das die HCV-spezifischen RNA-Abschnitte 5* NTR, NS3, NS4A, 
NS4B, NS5A, NS5B und 3' NTR und zusStzlich ein selektierbares Markergen (Selektionsgen) umfafit. 

2. Zeilkultursystem nach Anspruch 1, dadurch gekennzeichnet, 

daft die Hepatomazellen von einer handelsublichen Hepatomazellinie abstammen . 

3. Zeilkultursystem nach Anspruch 1 , dadurch gekennzeichnet, 

dafi die Hepatomazellen aus einer Hepatomaprimarzellkultur gewonnen sind. 

4. HCV-RNA-Konstrukt, dadurch gekennzeichnet, 

dafi es die HCV-spezifischen RNA-Abschnitte 5' NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3' NTR und 
zusatzlich ein selektierbares Markergen (Selektionsgen) umfafit. 

5. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, 

dafi es eine Nukleotidsequenz gemaft einem der Sequenzprotokolle SEQ ID NO: 1 bis SEQ ID NO: 1 1 umfafit. 

6. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, 

dafi die 3* NTR eine Nukleotidsequenz aufweist, die aus der Gruppe der nachfolgend aufgelisteten Nukleotid- 
sequenzen (a) bis (i) ausgewShlt ist: 

(a) ACG<K?GAG CTAAA CACTCCAGGCCAATAGGCCATCCTGTTTrri Tl 1 
TTAGCTTTTTT 1 1 T TTTC 1 TTTTTI TTGAGAGAGAGAGTCTC ACTCTG 
TTGCCCAGACTGGAGT 
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(b) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTC TTTTTTTTGA GAGAGAGAGT 
CTCACTCTGT TGCCCAGACT GGAGC 

(c) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTAATCTTT TTTTTTTTCT TTTTTTTTGA GAGAGAGAGT 
CTCACTCTGT TGCCCAGACT GCAGC 

(d) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAGTC TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG 
AGTCTCACTC TGTTGCCCAG ACTGGAGT 

(e) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG 
AGTCTCACTC TGTTGCCCAG ACTGGAGT 

(f) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TTGAGAGAGA 
GAGTCTCACT CTGTTGCCCA GACTGGAGT 

(g) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT CTTTTTTTTT GAGAGAGAGA 
GTCTCACTCT GTTGCCCAGA CTGGAGT 

(h) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTTAAT CTTTTTTTTT TTTTTCCTTT TTTTGAGAGA 
GAGAGTCTCA CTCTGTTGCC CAGACTGGAG T 

(i) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAATC TTTTTTTTTT TTTTCTTTTT TTTTTGAGAG 
AGAGAGTCTC ACTCTGTTGC CCAGACTGGA GT 



7. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 6, dadurch gekennzeichnet, 

dad das selektierbare Markergen ein Resistenzgen und insbesondere eine Antibiotikaresistenzgen ist. 

8. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 6, dadurch gekennzeichnet, 

daft das selektierbare Markergen ein Neomycinphosphotransferasegen ist. 

9. HCV-RNA-Konstrukt nach einem der Anspriiche 4 bis 8, dadurch gekennzeichnet, 

dall das selektierbare Markergen strangabwSrts der 5' NTR in die HCV-RNA Integrlert ist. 

10. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 9, dadurch gekennzeichnet, 
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daft das selektierbare Markergen uber ein Ribozym bzw. eine Erkennungsstelle fur ein Ribozym mit der HCV- 
RNA verbunden ist. 

11. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 10, dadurch gekennzeichnet, 

5 

daft es ein integriertes Reportergen aufweist. 

12. HCV-RNA-Konstrukt nach Anspruch 11, dadurch gekennzeichnet, 

10 daft das Reportergen ein Gen aus der Gruppe der Luziferasegene, dem CAT-Gen (Chloramphenicol-Acetayl- 

Transferase-Gen), dem lacZ-Gen (beta-Galaktosidasegen), der GFP-Gene (green-fluorescence-protein-Gene 
), dem GUS-Gen (Glukuronidasegen) und dem SEAP-Gen (Sezernierte-Alkalische-Phosphatase-Gen) ist. 

13. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 1 1 , dadurch gekennzeichnet, 

15 

daft deren Replikation die Expression eines (zellulSren) Surrogatmarkergens beeinfluftt. 

14. HCV-RNA-Konstrukt nach einem der Anspruche 11 bis 13, dadurch gekennzeichnet, 

20 daft das Resistenzgen derart in das offene Leseraster der HCV-RNA einkloniert ist, daft es erst nach einer pro- 

teolytischen Prozessierung in eine aktive Form uberfOhrbar ist. 

15. HCV-RNA-Konstrukt nach einem der Anspruche 11 bis 14, dadurch gekennzeichnet, 

25 daft das Reportergen und das selektierbare Markergen derart rSumlich in dem Konstrukt angeordnet sind, daft 

sie gemeinsam ein Fusionsprotein exprimleren. 

16. Zellkultursystem nach einem der Anspruche 1 bis 3 dadurch gekennzeichnet, 

30 daft das HCV-RNA-Konstrukt ein Konstrukt gemSft wenigstens einem der Anspruche 4 bis 15 ist. 

17. Zellkultursystem nach Anspruch 1, dadurch gekennzeichnet, 

daft die das HCV-RNA-Konstrukt enthaltenden Zellen bei der DSMZ, Braunschweig, BRD, unter der Hinterle- 
35 gungsnummer DSM ACC2394 (Laborbezeichnung HuBI 9-13) hinterlegt sind. 

18. Verwendung eines Zellkultursystems nach einem der AnsprOche 1 bis 3 Oder 16 bis 17 und/oder eines HCV-RNA- 
Konstrukts nach einem der Anspruche 4 bis 15 zur Herstellung und/oder Evaluierung und/oder Testung von The- 
rapeutika und/oder Diagnostika zur Behandlung von insbesondere HCV-lnfektionen. 

40. 

1 9. Verwendung eines Zellkultursystems nach einem der AnsprOche 1 bis 3 oder 1 6 bis 1 7 und/oder eines HCV-RNA- 
Konstrukts nach einem der Anspruche 4 bis 15 zur Herstellung eines Impfstoffes gegen HCV-lnfektlonen. 

20. Verwendung eines HCV-RNA-Konstrukts nach einem der Anspruche 4 bis 15 zur Herstellung einer leberzellspezi- 
45 fischen Genfahre fur die Gentherapie . 

21. HCV-RNA-Konstrukt nach einem der AnsprOche 4 bis 15, dadurch gekennzeichnet, 

daft es ein integriertes Fremdgen aufweist und dazu geeignet ist, dieses Fremdgen in eine Zielzelle einzu- 
50 schleusen, die zur Expression dieses Fremdgens geeignet ist. 

22. Verfahren zur Gewinnung von zellkultur-adaptierten Mutanten etnes HCV-RNA-Konstrukts gemSft einem der 
AnsprOche 4 bis 15, wobei die Mutanten gegenOber dem HCV-RNA-Konstrukt eine erhohte Replikationseffizienz 
aufweisen, dadurch gekennzeichnet, 

55 

daft man ein Zellkultursystem gemSft Anspruch 1, bei dem das eingeschleuste HCV-spezifische Genmaterial 
ein HCV-RNA-Konstrukt mit Selektionsgen nach einem der AnsprOche 4 bis 15 ist, auf/in dem dem Selektions- 
gen entsprechenden Selektionsmedium kultiviert, daft man die gewachsenen Zellklone erntet, und daft man 
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aus diesen Zellklonen die HCV-RNA-Konstrukte Oder Teile davon isoliert. 

23. Verfahren nach Anspruch 22, dadurch gekennzeichnet, 

daft man die isoiierten HCV-RNA-Konstrukte wenigstens einmal erneut passagiert, nSmlich in Zellen eines 
Zellkultursystems nach Anspruch 1 einschleust, das dabei erhaltene Zellkultursystem gemaft Anspruch 1, bei 
dem das eingeschleuste HCV-spezifische Genmaterial das isolierte HCV-RNA-Konstrukt mit Selektionsgen 
ist, auf/in dem dem Selektionsgen entsprechenden Selektionsmedium kultiviert, die gewachsenen Zellklone 
erntet und aus diesen Zellklonen die HCV-RNA-Konstrukte isoliert. 

24. Verfahren zur Herstellung von Mutanten eines HCV-Vollangengenoms oder eines HCV-Teilgenoms Oder eines 
beliebigen HCV- Konstrukts mit im Vergleich zu dem ursprunglichen HCV-VollSngengenom oder -Teilgenom oder 
HCV-RNA-Konstrukt erhfihter Replikattonseffizienz, dadurch gekennzeichnet, 

daft man mit einem Verfahren nach Anspruch 22 oder 23 eine zellkultur-adaptierte Mutante eines HCV-RNA- 
Konstrukts herstellt und isoliert, 

daft man die Nukleotid- und AminosSuresequenz dieser Mutante bestimmt und durch Vergleich mit der 
Nukleotid- und Aminosauresequenz des ursprOnglichen HCV-RNA-Konstrukts die Art, Anzahl und Positionen 
der Nukleotid- und AminosSuremutationen bestimmt, 

und daft man diese Mutationen entweder durch gezielte Mutagenese oder durch Austausch von Sequenzab- 
schnitten, die die betreffenden Mutationen enthalten, in ein (isoliertes) HCV- VollQngengenom oder ein HCV- 
Teilgenom oder ein beliebiges HCV-RNA-Konstrukt einfuhrt. 

25. Zellkultur-adaptiertes HCV-RNA-Konstrukt mit hoher Replikationseffizienz, dadurch gekennzeichnet, 

daft es durch Nukleotid- und/oder Aminosaure -Mutationen von einem HCV-RNA-Konstrukt nach einem der 
Anspruche 4 bis 15 ableitbar ist und daft es mit einem Verfahren nach einem der Anspruche 22 bis 24 erhSltlich 
ist. 

26. Zellkultur-adaptiertes HCV-RNA-Konstrukt nach Anspruch 25, dadurch gekennzeichnet, 

daft es einen oder mehrere der nachfolgend aufgefuhrten Aminosaureaustausche aufweist, nSmlich 1283 arg 
-> gly und/oder 1383 glu -> ala und/oder 1577 lys -> arg und/oder 1609 lys -> glu und/oder 1936 pro -> ser 
und/oder 2163 glu -> gly und/oder 2330 lys -> glu und/oder 2442 ile -> val aufweist. 

27. Zellkultur-adaptiertes HCV-RNA-Konstrukt nach Anspruch 25 oder 26, dadurch gekennzeichnet, 

daft es einen oder mehrere der in Tabelle 3 aufgefuhrten Nukleotid- und/oder Aminosaureaustausche auf- 
weist, wobei Tabelle 3 Bestandteil dieses Anspruchs ist. 

28. Zellkultur-adaptierte Mutanten eines HCV-RNA-Konstrukts oder eines HCV-Vollangengenoms mit im Vergleich zu 
dem ursprunglichen HCV-RNA-Konstrukt oder dem ursprOnglichen HCV-VollSngengenom erhohter Replikationsef- 
fizienz , dadurch gekennzeichnet, 

daft sie mit einem Verfahren erhaltlich ist, bei dem man in einem zellkultur-adaptierten HCV-RNA-Konstrukt 
nach Anspruch 24 durch Sequenzanalyse und Sequenzvergleich die Art und Anzahl der Mutationen bestimmt 
und diese Mutationen in ein HCV-RNA-Konstrukt, Insbesondere in ein HCV-RNA-Konstrukt gemaft einem der 
AnsprOche 4 bis 15, oder in ein (isoliertes) HCV-RNA-Vollangengenom einfOhrt, entweder durch gezielte Muta- 
genese oder durch Austausch von Sequenzabschnitten, die die betreffenden Mutationen enthalten. 

29. Hepatitis C Viruspartikel oder virus-Shnliche Partikel dadurch gekennzeichnet, 

daft sie mit einem Verfahren nach einem der Anspruche 22-24 erhSltlich sind. 

30. Zellen, infiziert mit Hepatitis C Viruspartikeln oder virus-ahnliche Partikeln gemSft Anspruch 29. 
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